统计学综合实操

1、R语言实操案例
1）导入elder1,elder2 到R语言
2）合并elder1,elder2，产生数据集tt
3）导出数据集tt
4）计算BMI
5）并将BMI分为4组，产生bmi1变量
6）根据收缩压、舒张压大小，将人群分为高血压组（SBP>=140 或者DBP>=90）和非高血压组，产生pressure变量
7）根据血糖（sugar），按照7.0的截值，将分为高血糖组和非高血糖组，产生sugar1变量
8）将income变量重新分为3组，产生income1变量
9）sex、bmi1、pressure、income1、marriage、sugar1因子化
10）将bmi1对照组设为第2组，marriage对照组设为第2组

# 1）导入elder1,elder2 到R语言：
setwd("E:/R")
getwd()
elder1<-read.csv(file="elder1.csv")
elder2<-read.csv(file="elder2.csv")

# 2）合并elder1,elder2，产生数据集tt：
tt<-merge(elder1,elder2,"ID",all=F)
dim(elder1)
dim(elder2)
dim(tt)

# 3）导出数据集tt：
write.csv(tt,file="tt.csv")

# 4）计算BMI：
tt$BMI<-tt$weight/(tt$height/100)^2

# 5）并将BMI分为4组，产生bmi1变量:
attach(tt)
tt$bmi1[BMI<18]<-"瘦弱"
tt$bmi1[BMI>=18]<-"正常"
tt$bmi1[BMI>=24]<-"超重"
tt$bmi1[BMI>=27.5]<-"肥胖"
levels(tt$bmi1)
table(tt$bmi1)

# 6）根据收缩压、舒张压大小，将人群分为高血压组（SBP>=140 或者DBP>=90）和非高血压组，产生pressure变量
tt$pressure<-ifelse(SBP>=140|DBP>=90,"高血压","非高血压")

# 7）根据血糖（sugar），按照7.0的截值，将分为高血糖组和非高血糖组，产生sugar1变量
tt$sugar1<-ifelse(sugar>=7,"高血糖","非高血糖")

# 8）将income变量重新分为3组，产生income1变量:
tt$income1[income<=4]<-"a"
tt$income1[income>4]<-"b"
tt$income1[income>6]<-"c"
levels(tt$income1)
table(tt$income1)

# 9）sex、bmi1、pressure、income1、marriage、sugar1因子化:
tt<-transform(tt,
              sex=as.factor(sex),
              bmi1=as.factor(bmi1),
              pressure=as.factor(pressure),
              income1=as.factor(income1),
              marriage=as.factor(marriage),
              sugar1=as.factor(sugar1))
class(tt$bmi1)
table(tt$bmi1)

# 10）将bmi1对照组设为第2组，marriage对照组设为第2组:
factor((tt$bmi1),levels=c("正常","瘦弱","超重","肥胖"))
factor((tt$marriage),levels=c(2,1,3,4))
table(tt$bmi1)
deatch(tt)

释雨寺 | Shakuameji