当前位置:网站首页>R语言 第一部分
R语言 第一部分
2022-07-31 06:47:00 【jeff one】
R语言 第一章
1.对象赋值与运行


2.脚本代码

3.帮助文件
4.向量,矩阵和数组
(1)向量
(2)矩阵

(3).数组

5.数据框
1)创建数据框


2)数据框的合并
mytable<-rbind(table1_1,table1_2)
cbind(mytable,table1_3[2:3]) # 按列合并数据框
3)数据框排序
6.因子和列表
1)因子
2)列表
7.R语言数据处理
1)数据读取和保存
1.读取包含标题的csv格式数据 table1_1<-read.csv(“C:/mydata/chap01/table1_1.csv”)
2. 读取不包含标题的csv格式数据
3. table1_1<-read.csv(“C:/mydata/chap01/table1_1.csv”,header=FALSE)
3.读取R格式数据 load(“C:/mydata/chap01/table1_1.RData”)
4.将tablel_1存为csv格式文件 write.csv(table1_1,file=“C:/mydata/chap01/table1_1.csv”)
2)随机数和数据抽样
3)生成频数分布表
一频表:
生成满意度的简单频数表。
data1_1<-read.csv(“C:/mydata/chap01/data1_1.csv”) attach(data1_1)
mytable1<-table(满意度);mytable1 prop.table(mytable1)*100
二频表:
生成性别和满意度的二维列联表。 data1_1<-read.csv(“C:/mydata/chap01/data1_1.csv”)
attach(data1_1) mytable2<-table(性别,满意度) # 生成性别和满意度的二维列联表 mytable2
addmargins(mytable2) # 为列联表添加边际和
addmargins(prop.table(mytable2)*100) # 将列联表转换成百分比表
多维表:
生成三维频数表(列变量为“满意度”)
data1_1<-read.csv(“C:/mydata/chap01/data1_1.csv”)
mytable3<-ftable(data1_1,row.vars=c(“性别”,“网购次数”),col.vars=“满意度”)
mytable3 生成三维频数表(列变量为"性别"和"满意度")
mytable4<-ftable(data1_1,row.vars=c(“网购次数”),col.vars=c(“性别”,“满意度”))
mytable4
4)生成频数分布表——数值数据——cut 函数
data1_2<-read.csv(“C:/mydata/chap01/data1_2.csv”)
v<-as.vector(data1_2KaTeX parse error: Expected 'EOF', got '#' at position 8: 销售额) #̲ 将销售额转化成向量 d<-t…Freq/sum(ddKaTeX parse error: Expected 'EOF', got '#' at position 14: Freq)*100,2) #̲ 计算频数百分比,结果保留2位…Var1,频数=df F r e q , 频数百分比 = d f Freq,频数百分比=df Freq,频数百分比=dfpercent)
重新命名并组织成频数分布表 mytable #
显示频数分布表
5) 生成频数分布表——数值数据——Freq 函数
data1_2<-read.csv(“C:/mydata/chap01/data1_2.csv”) library(DescTools)
加载包DescTools 使用默认分组,含上限值
tab<- Freq(data1_2 销售额 ) t a b 使用 F r e q 函数并生成频数分布表,指定组距 = 20 (不含上限值) t a b 1 < − F r e q ( d a t a 1 2 销售额) tab 使用Freq函数并生成频数分布表,指定组距=20(不含上限值) tab1<-Freq(data1_2 销售额)tab使用Freq函数并生成频数分布表,指定组距=20(不含上限值)tab1<−Freq(data12
销售额, breaks=c(500,520,540,560,580,625,600,620,640,660,680,700,720),right=FALSE)
指定组距=20,不含上限值
tab2<-data.frame(分组=tab1 l e v e l , 频数 = t a b 1 level,频数=tab1 level,频数=tab1freq,频数百分比=tab1 p e r c ∗ 100 , 累积频数 = t a b 1 perc*100,累积频数=tab1 perc∗100,累积频数=tab1cumfreq,累积百分比=tab1$cumperc*100)
重新命名频数表中的变量 print(tab2,digits=3)
用print函数定义输出结果的小数位数
边栏推荐
- mysql插入新字段方法
- [Interview: Concurrency 38: Multithreading: Thread Pool] Basic concepts of the ThreadPoolExecutor class
- 2022.07.18 _ a day
- Jobject 使用
- MySQL详解
- Introduction and self-order of bcos
- 2022.07.14_每日一题
- The Perfect Guide|How to use ODBC for Agentless Oracle Database Monitoring?
- Yu Mr Series 】 【 2022 July 022 - Go Go teaching course of container in the dictionary
- Machine Learning - Notes and Implementation of Linear Regression, Logistic Regression Problems
猜你喜欢
随机推荐
把 VS Code 当游戏机
[PSQL] SQL Basic Course Reading Notes (Chapter1-4)
2022.07.14_Daily Question
【网络攻防】常见的网络攻防技术——黑客攻防(通俗易懂版)
2022.07.15_Daily Question
CNN--各层的介绍
【第四章】详解Feign的实现原理
【解决】mysql本地计算机上的MySQL服务启动后停止。某些服务在未由其他服务或程序使用时将自动停止
关于yum源的配置及更新
DAY18:XSS 漏洞
MySQL table creation statement_Three commonly used MySQL table creation statements
【解决】npm ERR A complete log of this run can be found in npm ERR
04-SDRAM: Read Operation (Burst)
2022.07.14_Daily Question
《opencv学习笔记》-- 仿射变换
【Go】Go 语言切片(Slice)
【科普向】5G核心网架构和关键技术
深度学习通信领域相关经典论文、数据集整理分享
多进程全局变量失效、变量共享问题
解决安装 Bun 之后出现 zsh compinit: insecure directories, run compaudit for list. Ignore insecure directorie









