当前位置:网站首页>R语言:文本(字符串)处理与正则表达式
R语言:文本(字符串)处理与正则表达式
2022-07-31 11:12:00 【Mrrunsen】
处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本。R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要强多少倍。幸运的是R语言的可扩展能力很强,DNA/RNA/AA等生物序列现在已经可以使用R来处理。
nchar 字符的个数
toupper 转换为大写字符
tolower 转换为小写字符
substr 求字符串的字串
grep 基于正则表达式的匹配
sub 基于正则表达式的替换
strsplit 字符串分割
paste 字符向量连接
match 匹配元素位置组成的向量
R语言处理文本的能力虽然不强,但适当用用还是可以大幅提高工作效率的,而且有些文本操作还不得不用。高效处理文本少不了正则表达式(regular expression),虽然R在这方面先天不高效,但它处理字符串的绝大多数函数都使用正则表达式。
0、正则表达式简介:
正则表达式不是R的专属内容,所以用0编号,这里也只简单介绍,更详细的内容请查阅其他文章。
正则表达式是用于描述/匹配一个文本集合的表达式。
所有英文字母、数字和很多可显示的字符本身就是正则表达式,用于匹配它们自己。比如 ‘a’ 就是匹配字母 ‘a’ 的正则表达式
一些特殊的字符在正则表达式中不在用来描述它自身,它们在正则表达式中已经被“转义”,这些字符称为“元字符”。
perl类型的正则表达式中被转义的字符有:. \ | ( ) [ ] { } ^ $ * + ?。被转义的字符已经有特殊的意义,如点号 . 表示任意字符;
方括号表示选择方括号中的任意一个(如[a-z] 表示任意一个小写字符ÿ
边栏推荐
猜你喜欢
瑞吉外卖项目:新增菜品与菜品分页查询
一、excel转pdf格式jacob.jar
"JUC Concurrent Programming - Advanced" 06 - Immutability of Shared Models (Design of Immutable Classes | Use of Immutable Classes | Flyweight Pattern)
mysql 索引使用与优化
2022/7/28
准确率(Accuracy)、精度(Precision)、召回率(Recall)和 mAP 的图解
SQL力扣刷题七
Redis缓存面临的缓存穿透问题
【云原生监控系列第一篇】一文详解Prometheus普罗米修斯监控系统(山前前后各有风景,有风无风都很自由)
A Method for Ensuring Data Consistency of Multi-Party Subsystems
随机推荐
Redis - Basics
Redis缓存面临的缓存击穿问题
Inversion problem - key point
apisix-入门使用篇
【虚拟化生态平台】树莓派安装虚拟化平台操作流程
Detailed tutorial on distributed transaction Seata
Distributed Transactions - Introduction to Distributed Transactions, Distributed Transaction Framework Seata (AT Mode, Tcc Mode, Tcc Vs AT), Distributed Transactions - MQ
502 bad gateway原因、解决方法
SQLServer2019 installation (Windows)
Distributed id solution
1161. 最大层内元素和 (二叉树的层序遍历)
实现弹框组件
windows平台下的mysql启动等基本操作
下课看着文档走回实验室,我重新拾起了遗忘的SQL运算符
Can I find a Go job in 7 days?Learn Go with arrays and pointers
Life is endless, there are more questions, simple questions to learn knowledge points
Initial JDBC programming
Hospital management system database, course design, SQLserver, pure code design
IDEA 配置方法注释自动参数
MySQL 的 limit 分页查询及性能问题