当前位置:网站首页>R语言:文本(字符串)处理与正则表达式
R语言:文本(字符串)处理与正则表达式
2022-07-31 11:12:00 【Mrrunsen】
处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本。R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要强多少倍。幸运的是R语言的可扩展能力很强,DNA/RNA/AA等生物序列现在已经可以使用R来处理。
nchar 字符的个数
toupper 转换为大写字符
tolower 转换为小写字符
substr 求字符串的字串
grep 基于正则表达式的匹配
sub 基于正则表达式的替换
strsplit 字符串分割
paste 字符向量连接
match 匹配元素位置组成的向量
R语言处理文本的能力虽然不强,但适当用用还是可以大幅提高工作效率的,而且有些文本操作还不得不用。高效处理文本少不了正则表达式(regular expression),虽然R在这方面先天不高效,但它处理字符串的绝大多数函数都使用正则表达式。
0、正则表达式简介:
正则表达式不是R的专属内容,所以用0编号,这里也只简单介绍,更详细的内容请查阅其他文章。
正则表达式是用于描述/匹配一个文本集合的表达式。
所有英文字母、数字和很多可显示的字符本身就是正则表达式,用于匹配它们自己。比如 ‘a’ 就是匹配字母 ‘a’ 的正则表达式
一些特殊的字符在正则表达式中不在用来描述它自身,它们在正则表达式中已经被“转义”,这些字符称为“元字符”。
perl类型的正则表达式中被转义的字符有:. \ | ( ) [ ] { } ^ $ * + ?。被转义的字符已经有特殊的意义,如点号 . 表示任意字符;
方括号表示选择方括号中的任意一个(如[a-z] 表示任意一个小写字符ÿ
边栏推荐
- MySQL中JOIN的用法
- strings包详细文档+示例
- PyQt5快速开发与实战 9.5 PyQtGraph在PyQt中的应用 && 9.6 Plotly在PyQt中的应用
- 502 bad gateway原因、解决方法
- 透过开发抽奖小程序,体会创新与迭代
- 学自动化测试哪个培训机构好 试听课程后就选了这个地方学习
- Find a Go job in 7 days, Conditional statements to learn in Gopher, loop statements, Part 3
- Initial JDBC programming
- MySQL 的 limit 分页查询及性能问题
- Summary of several defragmentation schemes for MySQL (to solve the problem of not releasing space after deleting a large amount of data)
猜你喜欢
SQLServer2019安装(Windows)
初始JDBC 编程
【JWT】JWT 整合
Master SSR
才22岁!这位'00后'博士拟任职985高校!
《JUC并发编程 - 高级篇》06 - 共享模型之不可变(不可变类的设计 | 不可变类的使用 | 享元模式)
【软件工程之美 - 专栏笔记】33 | 测试工具:为什么不应该通过QQ/微信/邮件报Bug?
mysql 索引使用与优化
"JUC Concurrent Programming - Advanced" 06 - Immutability of Shared Models (Design of Immutable Classes | Use of Immutable Classes | Flyweight Pattern)
Hospital management system database, course design, SQLserver, pure code design
随机推荐
Threading(in thread main)
学自动化测试哪个培训机构好 试听课程后就选了这个地方学习
[ 图 论 ]二分图判定及其匹配(基础+提高)
SQLServer2019安装(Windows)
AWS亚马逊云账号注册,免费申请12个月亚马逊云服务器详细教程
mpu9150(driverack pa简明教程)
7 days to learn Go, Go structure + Go range to learn
使用内存映射加快PyTorch数据集的读取
502 bad gateway原因、解决方法
LeetCode 1161.最大层内元素和:层序遍历
Redis缓存面临的缓存击穿问题
Find a Go job in 7 days, Conditional statements to learn in Gopher, loop statements, Part 3
redis-企业级使用
MySQL row-level locks (row locks, adjacent key locks, gap locks)
Summary of three methods for SQL deduplication
Experience innovation and iteration through the development of lucky draw mini-programs
瑞吉外卖项目:新增菜品与菜品分页查询
redis-enterprise use
《云原生的本手、妙手和俗手》——2022全国新高考I卷作文
Hospital management system database, course design, SQLserver, pure code design