1、R语言实操案例
1)导入elder1,elder2 到R语言
2)合并elder1,elder2,产生数据集tt
3)导出数据集tt
4)计算BMI
5)并将BMI分为4组,产生bmi1变量
6)根据收缩压、舒张压大小,将人群分为高血压组(SBP>=140 或者DBP>=90)和非高血压组,产生pressure变量
7)根据血糖(sugar),按照7.0的截值,将分为高血糖组和非高血糖组,产生sugar1变量
8)将income变量重新分为3组,产生income1变量
9)sex、bmi1、pressure、income1、marriage、sugar1因子化
10)将bmi1对照组设为第2组,marriage对照组设为第2组

# 1)导入elder1,elder2 到R语言:
setwd("E:/R")
getwd()
elder1<-read.csv(file="elder1.csv")
elder2<-read.csv(file="elder2.csv")

# 2)合并elder1,elder2,产生数据集tt:
tt<-merge(elder1,elder2,"ID",all=F)
dim(elder1)
dim(elder2)
dim(tt)

# 3)导出数据集tt:
write.csv(tt,file="tt.csv")

# 4)计算BMI:
tt$BMI<-tt$weight/(tt$height/100)^2

# 5)并将BMI分为4组,产生bmi1变量:
attach(tt)
tt$bmi1[BMI<18]<-"瘦弱"
tt$bmi1[BMI>=18]<-"正常"
tt$bmi1[BMI>=24]<-"超重"
tt$bmi1[BMI>=27.5]<-"肥胖"
levels(tt$bmi1)
table(tt$bmi1)

# 6)根据收缩压、舒张压大小,将人群分为高血压组(SBP>=140 或者DBP>=90)和非高血压组,产生pressure变量
tt$pressure<-ifelse(SBP>=140|DBP>=90,"高血压","非高血压")

# 7)根据血糖(sugar),按照7.0的截值,将分为高血糖组和非高血糖组,产生sugar1变量
tt$sugar1<-ifelse(sugar>=7,"高血糖","非高血糖")

# 8)将income变量重新分为3组,产生income1变量:
tt$income1[income<=4]<-"a"
tt$income1[income>4]<-"b"
tt$income1[income>6]<-"c"
levels(tt$income1)
table(tt$income1)

# 9)sex、bmi1、pressure、income1、marriage、sugar1因子化:
tt<-transform(tt,
              sex=as.factor(sex),
              bmi1=as.factor(bmi1),
              pressure=as.factor(pressure),
              income1=as.factor(income1),
              marriage=as.factor(marriage),
              sugar1=as.factor(sugar1))
class(tt$bmi1)
table(tt$bmi1)

# 10)将bmi1对照组设为第2组,marriage对照组设为第2组:
factor((tt$bmi1),levels=c("正常","瘦弱","超重","肥胖"))
factor((tt$marriage),levels=c(2,1,3,4))
table(tt$bmi1)
deatch(tt)