当前位置：网站首页>R语言第一部分

R语言第一部分

2022-07-31 06:47:00 【jeff one】

R语言第一章

1.对象赋值与运行

请添加图片描述

2.脚本代码

请添加图片描述

3.帮助文件
请添加图片描述
4.向量，矩阵和数组
（1）向量

（2）矩阵

(3).数组

请添加图片描述
5.数据框
1）创建数据框

请添加图片描述

2）数据框的合并

mytable<-rbind(table1_1,table1_2)
cbind(mytable,table1_3[2:3]) # 按列合并数据框

3）数据框排序
请添加图片描述
6.因子和列表

1)因子
请添加图片描述
2）列表

7.R语言数据处理

1）数据读取和保存

1.读取包含标题的csv格式数据 table1_1<-read.csv(“C:/mydata/chap01/table1_1.csv”)
2. 读取不包含标题的csv格式数据
3. table1_1<-read.csv(“C:/mydata/chap01/table1_1.csv”,header=FALSE)
3.读取R格式数据 load(“C:/mydata/chap01/table1_1.RData”)
4.将tablel_1存为csv格式文件 write.csv(table1_1,file=“C:/mydata/chap01/table1_1.csv”)

2）随机数和数据抽样
请添加图片描述
3）生成频数分布表

一频表：

生成满意度的简单频数表。
data1_1<-read.csv(“C:/mydata/chap01/data1_1.csv”) attach(data1_1)
mytable1<-table(满意度);mytable1 prop.table(mytable1)*100

二频表：

生成性别和满意度的二维列联表。 data1_1<-read.csv(“C:/mydata/chap01/data1_1.csv”)
attach(data1_1) mytable2<-table(性别,满意度) # 生成性别和满意度的二维列联表 mytable2
addmargins(mytable2) # 为列联表添加边际和
addmargins(prop.table(mytable2)*100) # 将列联表转换成百分比表

多维表：

生成三维频数表（列变量为“满意度”）
data1_1<-read.csv(“C:/mydata/chap01/data1_1.csv”)
mytable3<-ftable(data1_1,row.vars=c(“性别”,“网购次数”),col.vars=“满意度”)
mytable3 生成三维频数表（列变量为"性别"和"满意度"）
mytable4<-ftable(data1_1,row.vars=c(“网购次数”),col.vars=c(“性别”,“满意度”))
mytable4

4）生成频数分布表——数值数据——cut 函数

data1_2<-read.csv(“C:/mydata/chap01/data1_2.csv”)
v<-as.vector(data1_2 $KaTeX parse error: Expected 'EOF', got '#' at position 8: 销售额) #̲ 将销售额转化成向量 d<-t\dots$ Freq/sum(dd $KaTeX parse error: Expected 'EOF', got '#' at position 14: Freq)*100,2) #̲ 计算频数百分比，结果保留2位\dots$ Var1,频数=df $F re q, 频数百分比 = df$ percent)
重新命名并组织成频数分布表 mytable #
显示频数分布表

5）生成频数分布表——数值数据——Freq 函数

data1_2<-read.csv(“C:/mydata/chap01/data1_2.csv”) library(DescTools)
加载包DescTools 使用默认分组，含上限值
tab<- Freq(data1_2 $销售额) tab 使用Freq函数并生成频数分布表，指定组距=20（不含上限值） tab1<-Freq(data1_2$
销售额, breaks=c(500,520,540,560,580,625,600,620,640,660,680,700,720),right=FALSE)
指定组距=20，不含上限值
tab2<-data.frame(分组=tab1 $l e v e l, 频数 = t ab 1$ freq,频数百分比=tab1 $p erc * 100, 累积频数 = t ab 1$ cumfreq,累积百分比=tab1$cumperc*100)
重新命名频数表中的变量 print(tab2,digits=3)
用print函数定义输出结果的小数位数