当前位置:网站首页>通俗解释:什么是临床预测模型
通俗解释:什么是临床预测模型
2022-08-01 20:32:00 【阿越1229】
获取更多R语言知识,请关注公众号:医学和生信笔记
“医学和生信笔记。专注R语言在临床医学中的使用,R语言数据分析和可视化。主要分享R语言做医学统计学、meta分析、网络药理学、临床预测模型、机器学习、生物信息学等。
很多人,对临床预测模型的概念很模糊,你上网一查,都是各种专有名词,然后告诉你已经在临床应用很久了,很有用,各种牛逼的杂志都可以见到临床预测模型的身影,在生信文章中更是普遍。
一通操作下来,你迷茫了,更加不知道临床预测模型是什么东西了,感觉懂了,又感觉没懂!
今天用通俗的语言来解释什么是临床预测模型,读完后,你应该真的懂了!
简单理解
临床预测模型,初听这个名字,或许会觉得很高大上,其实没那么复杂,你可以理解成一种方法,这种方法可以预测一个人到底是有病还是没病,或者预测一个人一段时间后会不会死,或者预测一个人的某种疾病会不会复发,又或者是预测一个样本到底是肿瘤还是正常组织......
再直白一点,临床预测模型是一个公式,根据这个公式,你提供一些基本信息,比如年龄、性别、体重、血红蛋白量等(或者某个基因的表达量等),就可以计算出这个人到底是有病还是没病!
目前很多疾病都需要做磁共振、做CT、病理才能确诊,假如你发现了一个公式,只要验个血,得到几个生化指标,就能根据你的公式算出来这个人到底是有病还是没病!这不比CT、磁共振、病理简单多了?值得推广。
所以,临床预测模型的本质是一种分类方法。通过这种方法,你可以对很多东西进行分类,比如,生和死、有病和没病、肿瘤和非肿瘤、复发和不复发等等。
既然是一种方法,那肯定就有准确和不准确,看名字也能知道,这只是一种预测,或者叫:猜(有根据的猜)! 如果你这种方法能和金标准相提并论,那说明你的方法很牛,如果恰好你的方法更加简单方便、经济适用,那你的方法真是太厉害了,非常有希望成为新的金标准!
那如何评价你的方法好还是不好呢?这就是临床预测模型的评价,通过各种指标(后面会详细介绍)、从各种不同的角度评价。
说了这么多,我怎么才能得到我的模型(或者叫方法)呢?这就是临床预测模型的另一个主要内容:临床预测模型的建立。
前面说过,临床预测模型本质上就是一个公式而已!说个最简单的,逻辑回归(logistic),大家应该都知道怎么构建逻辑回归吧?不就是自变量和因变量吗。给你几个自变量,一个二分类的因变量,大家通过SPSS点点点,就可以得到各个自变量的系数,然后就能写出逻辑回归方程了。你的这个逻辑回归方程,这就是一个临床预测模型了!给你几个自变量的值,根据这个方程,你就可以算出因变量的值,然后就可以分类了!
说到这里,相信你应该明白很多了!但是这还不够,你可能还听过什么机器学习、lasso、随机森林、支持向量机等等,别慌,这就是我们接下来要说的:临床预测模型和机器学习的关系。
临床预测模型和机器学习
机器学习,是不是听上去也高大上,但是对于搞临床的来说,不需要知道的太彻底,大概明白是什么就够了。
逻辑回归也是机器学习的一种,随机森林、决策树、支持向量机、lasso、岭回归、弹性网络、xgboost等等,这些都是和逻辑回归一样,就是不同的方法而已!
学过医学统计学的都知道(没学过可能也知道),如果因变量是连续性变量,那么我们就用多元线性回归,如果因变量是二分类变量,就用logistic回归(分类)。回归和分类,刚好就是机器学习的两个主要任务。很多方法,比如随机森林,既可以做回归,又可以做分类,而且准确度还很高,这就是为什么大家喜欢用其他方法的原因,主要是为了提高准确性。
临床预测模型,只是机器学习在医学领域的应用之一,回归和分类,适用于各行各业,所以在很多领域你都听过机器学习这几个字。此外,还有深度学习、人工智能等等,这些都可以简单的理解为更加牛逼的方法!
这些不同的方法都有各自适合的场景,在合适的场景下才能得到最好的表现,如何让模型表现的更好,那就需要学习一些机器学习的基本知识了,这些东西在bilibili一搜一大堆,大家可以自行学习,不过千万不要太沉迷哟!
但是你一搜机器学习教程,出来的都是推荐你吴恩达、西瓜书什么的,我不推荐,这些东西不是给生物医药领域的人看的,你看这些,可能就是听天书,毕竟很多医学生,连高数都是不学的!我比较推荐statquest,b站也可以搜到,这是一个国外的生物统计教授的课程,他的风格更适合我们!
临床预测模型和统计学
我们学过的医学统计学,在某些方面和机器学习是有交集的。比如,逻辑回归、多元线性回归,既是统计学方法,也是机器学习算法,这并不冲突,就像一个人在不同场合有不同身份一样。
在谈临床预测模型时,我们可能是偏向于机器学习多一点的,毕竟用到的很多方法,都是来自于机器学习领域。
你可能见到在很多生信文章中,使用一个模型并没有提前检验各种条件,直接就用了。但在医学统计学中,很多方法都是有适用条件的,符合条件才能用。哪种才是正确的呢?
其实不用纠结,别人能用你也能用,多看文章,你能发现各种用法,但是别人依然发了SCI,你也可以。如果非要说区别,这就涉及到先验学派和后验学派这些东西了,咱也不是很懂了,如果你有兴趣,可以自己探索。如果就是为了发文章,那就别搞这些没用的了,多看几篇高分SCI,跟着里面的思路模仿吧!
读到这里,你应该大致了解临床预测模型,不致于云里雾里了。
如果觉得这篇文章不错,欢迎点赞、在看、转发,让更多人看到;如果你还有疑问,也欢迎加入下面的交流群,继续探讨!
获取更多R语言知识,请关注公众号:医学和生信笔记
“医学和生信笔记。专注R语言在临床医学中的使用,R语言数据分析和可视化。主要分享R语言做医学统计学、meta分析、网络药理学、临床预测模型、机器学习、生物信息学等。
边栏推荐
- Where should I prepare for the PMP exam in September?
- Batch get protein .pdb files based on Uniprot ID/PDB ID
- 我的驾照考试笔记(4)
- To promote energy conservation institute 】 【 the opinions of the agricultural water price reform
- SIPp installation and use
- LTE时域、频域资源
- "No title"
- 第55章 业务逻辑之订单、支付实体定义
- Interview Blitz 70: What are sticky packs and half packs?How to deal with it?
- 多线程之生产者与消费者
猜你喜欢
研究生新同学,牛人看英文文献的经验,值得你收藏
Qt设置应用程序开机自启 解决设置失败原因
【Social Media Marketing】How to know if your WhatsApp is blocked?
【nn.Parameter()】生成和为什么要初始化
XSS range intermediate bypass
What is the difference between a utility model patent and an invention patent?Understand in seconds!
17. Load balancing
LTE time domain and frequency domain resources
9月备考PMP,应该从哪里备考?
终于有人把AB实验讲明白了
随机推荐
【Dart】dart之mixin探究
【节能学院】智能操控装置在高压开关柜的应用
Go 语言中常见的坑
Little data on how to learn?Jida latest small learning data review, 26 PDF page covers the 269 - page document small data learning theory, method and application are expounded
【torch】张量乘法:matmul,einsum
【节能学院】数据机房中智能小母线与列头柜方案的对比分析
Intranet penetration lanproxy deployment
9月备考PMP,应该从哪里备考?
SIPp installation and use
启明云端分享|盘点ESP8684开发板有哪些功能
密码学的基础:X.690和对应的BER CER DER编码
通配符 SSL/TLS 证书
[Personal work] Wireless network image transmission module
【Dart】dart构造函数学习记录(含dart单例模式写法)
第57章 业务逻辑之业务实体与数据库表的映射规则定义
环境变量,进程地址空间
Interview assault 70: what is the glue bag and a bag?How to solve?
myid file is missing
第56章 业务逻辑之物流/配送实体定义
30-day question brushing plan (5)