当前位置:网站首页>R语言:文本(字符串)处理与正则表达式
R语言:文本(字符串)处理与正则表达式
2022-07-31 11:12:00 【Mrrunsen】
处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本。R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要强多少倍。幸运的是R语言的可扩展能力很强,DNA/RNA/AA等生物序列现在已经可以使用R来处理。
nchar 字符的个数
toupper 转换为大写字符
tolower 转换为小写字符
substr 求字符串的字串
grep 基于正则表达式的匹配
sub 基于正则表达式的替换
strsplit 字符串分割
paste 字符向量连接
match 匹配元素位置组成的向量
R语言处理文本的能力虽然不强,但适当用用还是可以大幅提高工作效率的,而且有些文本操作还不得不用。高效处理文本少不了正则表达式(regular expression),虽然R在这方面先天不高效,但它处理字符串的绝大多数函数都使用正则表达式。
0、正则表达式简介:
正则表达式不是R的专属内容,所以用0编号,这里也只简单介绍,更详细的内容请查阅其他文章。
正则表达式是用于描述/匹配一个文本集合的表达式。
所有英文字母、数字和很多可显示的字符本身就是正则表达式,用于匹配它们自己。比如 ‘a’ 就是匹配字母 ‘a’ 的正则表达式
一些特殊的字符在正则表达式中不在用来描述它自身,它们在正则表达式中已经被“转义”,这些字符称为“元字符”。
perl类型的正则表达式中被转义的字符有:. \ | ( ) [ ] { } ^ $ * + ?。被转义的字符已经有特殊的意义,如点号 . 表示任意字符;
方括号表示选择方括号中的任意一个(如[a-z] 表示任意一个小写字符ÿ
边栏推荐
猜你喜欢
随机推荐
透过开发抽奖小程序,体会创新与迭代
7 天学个Go,Go 结构体 + Go range 来学学
unity-shader-2
「MySQL」- 基础增删改查
蓝牙协议栈开发板 STM32F1 跑蓝牙协议栈 –传统蓝牙搜索演示以及实现原理[通俗易懂]
透过开发抽奖小程序,体会创新与迭代
Insertion and deletion of doubly linked list
SQLSERVER merges subquery data into one field
淀粉与纤维素
St. Regis Takeaway Project: File Upload and Download
Android studio连接MySQL并完成简单的登录注册功能
5 open source Rust web development frameworks, which one do you choose?
Unix知识:shell详细解读
[Part 1 of Cloud Native Monitoring Series] A detailed explanation of Prometheus monitoring system
使用内存映射加快PyTorch数据集的读取
3D激光SLAM:LeGO-LOAM论文解读---完整篇
Redis缓存面临的缓存雪崩问题
Redis缓存面临的缓存击穿问题
The principle of v-model
5 个开源的 Rust Web 开发框架,你选择哪个?









