当前位置:网站首页>論文筆記:LBCF: A Large-Scale Budget-Constrained Causal Forest Algorithm
論文筆記:LBCF: A Large-Scale Budget-Constrained Causal Forest Algorithm
2022-06-25 16:35:00 【#Super Pig】
論文原文:M. Ai et al., “LBCF: A Large-Scale Budget-Constrained Causal Forest Algorithm,” in Proceedings of the ACM Web Conference 2022, New York, NY, USA, 2022, pp. 2310–2319. doi: 10.1145/3485447.3512103.
Motivation
該工作以金幣下發場景為背景,評估金幣下發數量對用戶觀看時長的因果效應,並基於評估結果設計了個性化下發機制。
challenge:
- 大規模用戶量;
- multi-treatment;
contribution:
- 提出了LBCF方法解决了以上兩個問題;
- 提出了新的模型效果評估指標;
- 在真實數據上進行了實驗;
related work:
這一部分主要是圍繞自己的challenge講述了現有工作的不足,共分兩類:
- 第一類:LBCF批評他們在進行决策時采用貪心策略,並且通過舉例說明這類貪心策略無法達到treament effect的最優值【錶1】
- 第二類:LBCF指出第二類雖然采用了優化算法來進行决策,但在面對大規模數據時性能錶現不足,主要是:1. 他們只能做到cohort-level的優化,無法實現member-level的優化;2. 他們在解决multi-treatment時是構造了多棵causal forest,這樣的話,不同forest所處的特征空間不同,那麼評估出來的treatment effect也不可比。
Methodology
針對related work裏的問題,LBCF提出了相應的解决方法,方法論主要分成兩大部分:
- 第一部分是causal forest的構建,在這一部分的主要貢獻就是提出了新的分裂標准,並將他們的森林起名為UDCF;
- 第二部分是優化問題的構造,在這一部分又提出了適用於大規模數據的優化算法,起名為DGB;
問題定義:
值得一提的是LBCF對multi-treatment下CATE的定義:
他們以Y(T=0)為基線,只考慮Y(T=j)到Y(T=0)的差值。
UDCF
作者針對multi-treatment問題,認為他們所構造的森林(即UDCF)需要滿足如下兩個要求:
- Unified:是指,UDCF需要使得各個treatment的effect評估處於同一特征空間;
- Discriminative :是指,UDCF需要使得不同treatment對應的effect足够异質;
所以,UDCF的全稱也就是Unified Discriminative Causal Forest。
為了滿足上述兩個要求,作者分別提出了兩個新的分裂標准:
- inter split:該標准是將GRF用於CATE的分裂標准進行了一點改動,使得CF能應用於multi-treatment的情形,滿足了Unified特性,其形式化錶達入如下:

不熟悉GRF的移步論文筆記:GRF
這個分裂標准延用了GRF的思想,是想要最大化子節點之間的异質性; - Intra split:該標准是針對Discriminative特性提出的【還附上了假設1】,其思想是最大化不同treatment之間的异質性,形式化錶達如下:

基於以上兩個分裂標准,作者提出了節點分裂的計算步驟:- 首先根據inter split標准篩選出m個候選者;
- 再根據intra split標准篩選出最優分裂;
DGB
也是解决一個優化問題:
細節暫略
边栏推荐
- [untitled]
- Principle analysis of ThreadLocal source code
- About the use of Aidl, complex data transmission
- Problems caused by using ApplicationContext to render layout
- Common APIs and exception mechanisms
- Linux-MySQL数据库之高级SQL 语句一
- Deep learning pytorch cifar10 dataset training "suggestions collection"
- 心樓:華為運動健康的七年築造之旅
- Why does golang's modification of slice data affect the data of other slices?
- Flutter assembly
猜你喜欢

The third day of mysql45

论文笔记:LBCF: A Large-Scale Budget-Constrained Causal Forest Algorithm

使用hbuilder X创建uniapp项目

Xinlou: Huawei's seven-year building journey of sports health

Preliminary understanding of JVM

解析数仓lazyagg查询重写优化

10 Super VIM plug-ins, I can't put them down

Day_ fourteen

心楼:华为运动健康的七年筑造之旅

The first day of reading mysql45
随机推荐
MySQL_ JDBC
Unity技术手册 - 生命周期旋转RotationOverLifetime-速度旋转RotationBySpeed-外力ExternalForces
mysql整体架构和语句的执行流程
Message format of Modbus (PLC)
普通人的2022春招总结(阿里、腾讯offer)
The database records are read through the system time under the Android system, causing the problem of incomplete Reading Records!
Understand the execution sequence of try catch finally in one diagram
赫尔辛基交通安全改善项目部署Velodyne Lidar智能基础设施解决方案
What are some tricks that novice programmers don't know?
Day_ 18 hash table, generic
Summary of 2022 spring moves of ordinary people (Alibaba and Tencent offer)
一行代码可以做什么?
Rxjs TakeUntil 操作符的学习笔记
Record learning of hystrix knowledge --20210929
Catheon gaming appointed mark Aubrey, former Asia Pacific head of Activision Blizzard, as CEO
八种button的hover效果
20省市公布元宇宙路线图
Introduction to MgO 256gb NAND flash chip
Swift responsive programming
心樓:華為運動健康的七年築造之旅