当前位置:网站首页>通俗解释:什么是临床预测模型
通俗解释:什么是临床预测模型
2022-08-01 20:32:00 【阿越1229】
获取更多R语言知识,请关注公众号:医学和生信笔记
“医学和生信笔记。专注R语言在临床医学中的使用,R语言数据分析和可视化。主要分享R语言做医学统计学、meta分析、网络药理学、临床预测模型、机器学习、生物信息学等。
很多人,对临床预测模型的概念很模糊,你上网一查,都是各种专有名词,然后告诉你已经在临床应用很久了,很有用,各种牛逼的杂志都可以见到临床预测模型的身影,在生信文章中更是普遍。
一通操作下来,你迷茫了,更加不知道临床预测模型是什么东西了,感觉懂了,又感觉没懂!
今天用通俗的语言来解释什么是临床预测模型,读完后,你应该真的懂了!
简单理解
临床预测模型,初听这个名字,或许会觉得很高大上,其实没那么复杂,你可以理解成一种方法,这种方法可以预测一个人到底是有病还是没病,或者预测一个人一段时间后会不会死,或者预测一个人的某种疾病会不会复发,又或者是预测一个样本到底是肿瘤还是正常组织......
再直白一点,临床预测模型是一个公式,根据这个公式,你提供一些基本信息,比如年龄、性别、体重、血红蛋白量等(或者某个基因的表达量等),就可以计算出这个人到底是有病还是没病!
目前很多疾病都需要做磁共振、做CT、病理才能确诊,假如你发现了一个公式,只要验个血,得到几个生化指标,就能根据你的公式算出来这个人到底是有病还是没病!这不比CT、磁共振、病理简单多了?值得推广。
所以,临床预测模型的本质是一种分类方法。通过这种方法,你可以对很多东西进行分类,比如,生和死、有病和没病、肿瘤和非肿瘤、复发和不复发等等。
既然是一种方法,那肯定就有准确和不准确,看名字也能知道,这只是一种预测,或者叫:猜(有根据的猜)! 如果你这种方法能和金标准相提并论,那说明你的方法很牛,如果恰好你的方法更加简单方便、经济适用,那你的方法真是太厉害了,非常有希望成为新的金标准!
那如何评价你的方法好还是不好呢?这就是临床预测模型的评价,通过各种指标(后面会详细介绍)、从各种不同的角度评价。
说了这么多,我怎么才能得到我的模型(或者叫方法)呢?这就是临床预测模型的另一个主要内容:临床预测模型的建立。
前面说过,临床预测模型本质上就是一个公式而已!说个最简单的,逻辑回归(logistic),大家应该都知道怎么构建逻辑回归吧?不就是自变量和因变量吗。给你几个自变量,一个二分类的因变量,大家通过SPSS点点点,就可以得到各个自变量的系数,然后就能写出逻辑回归方程了。你的这个逻辑回归方程,这就是一个临床预测模型了!给你几个自变量的值,根据这个方程,你就可以算出因变量的值,然后就可以分类了!
说到这里,相信你应该明白很多了!但是这还不够,你可能还听过什么机器学习、lasso、随机森林、支持向量机等等,别慌,这就是我们接下来要说的:临床预测模型和机器学习的关系。
临床预测模型和机器学习
机器学习,是不是听上去也高大上,但是对于搞临床的来说,不需要知道的太彻底,大概明白是什么就够了。
逻辑回归也是机器学习的一种,随机森林、决策树、支持向量机、lasso、岭回归、弹性网络、xgboost等等,这些都是和逻辑回归一样,就是不同的方法而已!
学过医学统计学的都知道(没学过可能也知道),如果因变量是连续性变量,那么我们就用多元线性回归,如果因变量是二分类变量,就用logistic回归(分类)。回归和分类,刚好就是机器学习的两个主要任务。很多方法,比如随机森林,既可以做回归,又可以做分类,而且准确度还很高,这就是为什么大家喜欢用其他方法的原因,主要是为了提高准确性。
临床预测模型,只是机器学习在医学领域的应用之一,回归和分类,适用于各行各业,所以在很多领域你都听过机器学习这几个字。此外,还有深度学习、人工智能等等,这些都可以简单的理解为更加牛逼的方法!
这些不同的方法都有各自适合的场景,在合适的场景下才能得到最好的表现,如何让模型表现的更好,那就需要学习一些机器学习的基本知识了,这些东西在bilibili一搜一大堆,大家可以自行学习,不过千万不要太沉迷哟!
但是你一搜机器学习教程,出来的都是推荐你吴恩达、西瓜书什么的,我不推荐,这些东西不是给生物医药领域的人看的,你看这些,可能就是听天书,毕竟很多医学生,连高数都是不学的!我比较推荐statquest,b站也可以搜到,这是一个国外的生物统计教授的课程,他的风格更适合我们!
临床预测模型和统计学
我们学过的医学统计学,在某些方面和机器学习是有交集的。比如,逻辑回归、多元线性回归,既是统计学方法,也是机器学习算法,这并不冲突,就像一个人在不同场合有不同身份一样。
在谈临床预测模型时,我们可能是偏向于机器学习多一点的,毕竟用到的很多方法,都是来自于机器学习领域。
你可能见到在很多生信文章中,使用一个模型并没有提前检验各种条件,直接就用了。但在医学统计学中,很多方法都是有适用条件的,符合条件才能用。哪种才是正确的呢?
其实不用纠结,别人能用你也能用,多看文章,你能发现各种用法,但是别人依然发了SCI,你也可以。如果非要说区别,这就涉及到先验学派和后验学派这些东西了,咱也不是很懂了,如果你有兴趣,可以自己探索。如果就是为了发文章,那就别搞这些没用的了,多看几篇高分SCI,跟着里面的思路模仿吧!
读到这里,你应该大致了解临床预测模型,不致于云里雾里了。
如果觉得这篇文章不错,欢迎点赞、在看、转发,让更多人看到;如果你还有疑问,也欢迎加入下面的交流群,继续探讨!
获取更多R语言知识,请关注公众号:医学和生信笔记
“医学和生信笔记。专注R语言在临床医学中的使用,R语言数据分析和可视化。主要分享R语言做医学统计学、meta分析、网络药理学、临床预测模型、机器学习、生物信息学等。
边栏推荐
猜你喜欢
随机推荐
Little data on how to learn?Jida latest small learning data review, 26 PDF page covers the 269 - page document small data learning theory, method and application are expounded
使用微信公众号给指定微信用户发送信息
Zheng Xiangling, Chairman of Tide Pharmaceuticals, won the "2022 Outstanding Influential Entrepreneur Award" Tide Pharmaceuticals won the "Corporate Social Responsibility Model Award"
大整数相加,相减,相乘,大整数与普通整数的相乘,相除
Multithreaded producers and consumers
【多任务优化】DWA、DTP、Gradnorm(CVPR 2019、ECCV 2018、 ICML 2018)
数据库内核面试中我不会的问题(1)
乐观锁批量跟新 纯SQL
作为程序员你应该会的软件
Batch get protein .pdb files based on Uniprot ID/PDB ID
泰德制药董事长郑翔玲荣膺“2022卓越影响力企业家奖” 泰德制药荣获“企业社会责任典范奖”
第60章 ApplicationPart自动集成整体性和独立性插件项
字符串
Go 语言中常见的坑
Does LabVIEW really close the COM port using VISA Close?
Arthas 常用命令
漏刻有时文档系统之XE培训系统二次开发配置手册
面试突击70:什么是粘包和半包?怎么解决?
myid file is missing
AQS原理和介绍









