当前位置:网站首页>数据分析知识点搜集(纯粹的搜集)
数据分析知识点搜集(纯粹的搜集)
2022-08-03 22:53:00 【二思后行】
A/B Testing
A/B 测试是促进业务持续增长的最实用、最有效的方式。
主要是实验组和对照组的对比,观察(A/B差别的显著性)是否符合统计上的显著和业务上的显著。
产品迭代流程
产品 / 业务迭代的流程大概分为 3 步:
- 具体的业务问题催生出迭代的想法,比如出现业务问题后,团队会提出具体的迭代方案;
- 团队论证方案的可行性和效果;
- 论证完成后,具体实施迭代方案。
棣莫弗—拉普拉斯中心极限定理
棣莫弗—拉普拉斯中心极限定理(De Moivre-Laplace),即二项分布以正态分布为其极限分布定律。
中心 极限定理
不管是什么概率分布,只要样本数据量足够大,样本 统计量近似服从 正态分布
中心极限定理在A/B测试中的应用
中心极限定理是概率论中最重要的一类定理,它支撑着和置信区间相关的T检验和假设检验的计算公式和相关理论。如果没有这个定理,之后的推导公式都是不成立的。
事实上,以上对于中心极限定理的两种解读,在不同的场景下都可以对A/B测试的指标置信区间判定起到一定作用。
- 对于属于正态分布的指标数据,我们可以很快捷地对它进行下一步假设检验,并推算出对应的置信区间;
- 而对于那些不属于正态分布的数据,根据中心极限定理,在样本容量很大(>30)时,总体参数的抽样分布是趋向于正态分布的,最终都可以依据正态分布的检验公式对它进行下一步分析。
幂律分布
统计物理学家习惯于把服从幂律分布的现象称为无标度现象,即,系统中个体的尺度相差悬殊,缺乏一个优选的规模。可以说,凡有生命的地方,有进化,有竞争的地方都会出现不同程度的无标度现象。
指标的统计属性
- 均值类的指标,比如用户的平均使用时长、平均购买金额、平均购买频率,等等。
- 概率类的指标,比如用户点击的概率(点击率)、转化的概率(转化率)、购买的概率(购买率),等等。
在数量足够大时,均值类指标服从正态分布;概率类指标本质上服从二项分布,但当数量足够大时,也服从正态分布。
假设检验
Null Hypothesis
Alternative Hypothesis
- 零假设是,实验组和对照组的点击率是相同的。
- 备择假设是,实验组和对照组的点击率是不同的。
在 A/B 测试的实践中,更推荐使用双尾检验。
T检验和Z检验
根本是,方差是否知道。
不知道,就用样本反差估计总体方差,然后用t检验,但是在现在的大数据时代,基本上只要样本量>30就可以认为Z和T检验是一样的。
第一类错误 a
假阳性概率
误诊
第二类错误 b
假阴性概率
漏诊
把握度power
1-b = 不漏的概率
P值
当零假设成立,观测到对照组和实验组不同的概率。
边栏推荐
- Work Subtotal QT Packing
- 2022-08-03 oracle执行慢SQL-Q17对比
- BMN: Boundary-Matching Network for Temporal Action Proposal Generation阅读笔记
- FinClip最易用的智能电视小程序
- UVa 437 - The Tower of Babylon (White Book)
- 最小化安装debian11
- 软件测试内卷严重,如何提升自己的竞争力呢?
- HCIP BGP实验报告
- ML之interpret:基于titanic泰坦尼克是否获救二分类预测数据集利用interpret实现EBC模型可解释性之全局解释/局部解释案例
- CAS:178744-28-0,mPEG-DSPE,DSPE-mPEG,甲氧基-聚乙二醇-磷脂酰乙醇胺供应
猜你喜欢
The salary of soft testers at each stage, come to Kangkang, how much can you get?
软测人每个阶段的薪资待遇,快来康康你能拿多少?
Lift, Splat, Shoot: Encoding Images from Arbitrary Camera Rigs by Implicitly Unprojecting to 3D 论文笔记
冰河又一MySQL力作出版(文末送书)!!
.NET6之MiniAPI(十四):跨域CORS(上)
BMN: Boundary-Matching Network for Temporal Action Proposal Generation阅读笔记
for loop exercises
Cisco ike2 IPSec configuration
亿流量大考(2):开发一套高容错分布式系统
Interpretation of ML: A case of global interpretation/local interpretation of EBC model interpretability based on titanic titanic rescued binary prediction data set using interpret
随机推荐
PowerMockup 4.3.4::::Crack
软测人每个阶段的薪资待遇,快来康康你能拿多少?
【开源框架】国内首个通用云计算框架,任意程序都可做成云计算。
Websocket multi-threaded sending message error TEXT_PARTIAL_WRITING--Use case of spin lock replacing synchronized exclusive lock
Gains double award | know micro easily won the "2021 China digital twin solution suppliers in excellence" "made in China's smart excellent recommended products" double award!
静态文件快速建站
Codeup刷题笔记-简单模拟
Boss: There are too many systems in the company, can you realize account interoperability?
override learning (parent and child)
2022/8/3 考试总结
获国际权威认可 | 云扩科技入选《RPA全球市场格局报告,Q3 2022》
云平台建设解决方案
Summary bug 】 【 Elipse garbled solution project code in Chinese!
Optimize the query (work in progress)
HDU 5655 CA Loves Stick
Why do we need callbacks
Embedded systems: overview
Testng listener
Embedded Systems: Clocks
【RYU】rest_router.py源码解析