当前位置:网站首页>数据分析知识点搜集(纯粹的搜集)
数据分析知识点搜集(纯粹的搜集)
2022-08-03 22:53:00 【二思后行】
A/B Testing
A/B 测试是促进业务持续增长的最实用、最有效的方式。
主要是实验组和对照组的对比,观察(A/B差别的显著性)是否符合统计上的显著和业务上的显著。
产品迭代流程
产品 / 业务迭代的流程大概分为 3 步:
- 具体的业务问题催生出迭代的想法,比如出现业务问题后,团队会提出具体的迭代方案;
- 团队论证方案的可行性和效果;
- 论证完成后,具体实施迭代方案。
棣莫弗—拉普拉斯中心极限定理
棣莫弗—拉普拉斯中心极限定理(De Moivre-Laplace),即二项分布以正态分布为其极限分布定律。
中心 极限定理
不管是什么概率分布,只要样本数据量足够大,样本 统计量近似服从 正态分布
中心极限定理在A/B测试中的应用
中心极限定理是概率论中最重要的一类定理,它支撑着和置信区间相关的T检验和假设检验的计算公式和相关理论。如果没有这个定理,之后的推导公式都是不成立的。
事实上,以上对于中心极限定理的两种解读,在不同的场景下都可以对A/B测试的指标置信区间判定起到一定作用。
- 对于属于正态分布的指标数据,我们可以很快捷地对它进行下一步假设检验,并推算出对应的置信区间;
- 而对于那些不属于正态分布的数据,根据中心极限定理,在样本容量很大(>30)时,总体参数的抽样分布是趋向于正态分布的,最终都可以依据正态分布的检验公式对它进行下一步分析。
幂律分布
统计物理学家习惯于把服从幂律分布的现象称为无标度现象,即,系统中个体的尺度相差悬殊,缺乏一个优选的规模。可以说,凡有生命的地方,有进化,有竞争的地方都会出现不同程度的无标度现象。
指标的统计属性
- 均值类的指标,比如用户的平均使用时长、平均购买金额、平均购买频率,等等。
- 概率类的指标,比如用户点击的概率(点击率)、转化的概率(转化率)、购买的概率(购买率),等等。
在数量足够大时,均值类指标服从正态分布;概率类指标本质上服从二项分布,但当数量足够大时,也服从正态分布。
假设检验
Null Hypothesis
Alternative Hypothesis
- 零假设是,实验组和对照组的点击率是相同的。
- 备择假设是,实验组和对照组的点击率是不同的。
在 A/B 测试的实践中,更推荐使用双尾检验。
T检验和Z检验
根本是,方差是否知道。
不知道,就用样本反差估计总体方差,然后用t检验,但是在现在的大数据时代,基本上只要样本量>30就可以认为Z和T检验是一样的。
第一类错误 a
假阳性概率
误诊
第二类错误 b
假阴性概率
漏诊
把握度power
1-b = 不漏的概率
P值
当零假设成立,观测到对照组和实验组不同的概率。
边栏推荐
- 重发布实验报告
- Testng listener
- Create function report error, prompting DECLARE definition syntax problem
- HCIP BGP lab report
- SPOJ 2774 Longest Common Substring(两串求公共子串 SAM)
- Take an example of a web worker
- With 4 years of work experience, the 5 communication methods between multi-threads can't be said, can you believe it?
- 工作小计 QT打包
- 【RYU】rest_router.py源码解析
- ML's yellowbrick: A case of interpretability (threshold map) for LoR logistic regression model using yellowbrick based on whether Titanic was rescued or not based on the two-class prediction dataset
猜你喜欢
Embedded Systems: Clocks
V8中的快慢数组(附源码、图文更易理解)
pikachu Over permission
113. 授人以渔 - 如何自行查询任意 SAP UI5 控件属性的文档和技术实现细节
Recognized by International Authorities | Yunzhuang Technology was selected in "RPA Global Market Pattern Report, Q3 2022"
PowerMockup 4.3.4::::Crack
113. Teach a Man how to fish - How to query the documentation and technical implementation details of any SAP UI5 control property by yourself
AOSP CameraLatencyHistogram的原理与使用
2019年10月SQL注入的两倍
FinClip,助长智能电视更多想象空间
随机推荐
如何基于WPF写一款数据库文档管理工具(二)
redis持久化方式
utils 定时器
Internet user account information management regulations come into effect today: must crack down on account trading and gray products
Embedded Systems: Clocks
Testng监听器
On the Qixi Festival of 2022, I will offer 7 exquisite confession codes, and at the same time teach you to quickly change the source code for your own use
Live Preview | Build Business Intelligence, Quickly Embrace Financial Digital Transformation
静态文件快速建站
Adobe是什么?
软测人每个阶段的薪资待遇,快来康康你能拿多少?
Recognized by International Authorities | Yunzhuang Technology was selected in "RPA Global Market Pattern Report, Q3 2022"
授人以渔 - 如何自行查询任意 SAP UI5 控件属性的文档和技术实现细节试读版
What is the difference between the generator version and the viewer version?
V8中的快慢数组(附源码、图文更易理解)
Research status of target detection at home and abroad
Software testing is seriously involution, how to improve your competitiveness?
Fluorescein-PEG-CLS,胆固醇-聚乙二醇-荧光素科研试剂
What is memoization and what is it good for?
PowerMockup 4.3.4::::Crack