当前位置:网站首页>ICML 2022 | Meta提出魯棒的多目標貝葉斯優化方法,有效應對輸入噪聲
ICML 2022 | Meta提出魯棒的多目標貝葉斯優化方法,有效應對輸入噪聲
2022-07-05 17:24:00 【PaperWeekly】

作者 | 楊澤群
單比特 | 中國人民大學
研究方向 | 多模態學習

論文標題:
Robust Multi-Objective Bayesian Optimization Under Input Noise
論文鏈接:
https://arxiv.org/abs/2202.07549
項目鏈接:
https://github.com/facebookresearch/robust_mobo
本文是 facebook 發錶於 ICML 2022 的一篇工作,其在理論角度上對有輸入噪聲的多目標貝葉斯優化進行了分析。

引言
本文面向多目標優化的輸入噪聲問題,結合貝葉斯優化和帕累托最優的思想設計並優化了全局多目標風險價值,以解决對輸入噪聲敏感的黑盒約束的問題。貝葉斯優化通過調整設計參數,可以優化高評估成本的黑盒性能指標。雖然現有很多方法被提出用於在輸入噪聲下優化單一目標,但目前仍然缺少能够解决存在多個目標對輸入擾動敏感的實際問題的方法。
在這項工作中,作者提出了第一個魯棒的多目標貝葉斯優化方法以應對輸入噪聲。作者將目標形式化為優化一種不確定目標的風險度量,即多變量風險值(MVaR)。由於直接優化 MVaR 在許多情况下在計算上是不可行的,作者提出了一種可擴展的、基於理論的方法來使用隨機尺度來優化 MVaR。實驗上而言,該方法在數據集上顯著優於其他方法,並有效地實現了最優魯棒設計。

▲ 圖1:簡易數據集上錶明非魯棒設計的多目標優化的最優值對輸入噪聲敏感,並給出了最優點集的選取演示。
這裏通過圖 1 來梳理一下作者提出的問題:左圖中,非魯棒設計(紫色 )和魯棒設計(綠色 )的標稱值使用正方形錶示。加號標記錶示每個設計在零均值高斯輸入噪聲下的目標值,標准差為 0.1。可以看到,雖然非魯棒設計可能會獲得局部較優的結果,但是其在輸入擾動下的不穩定,容易導致更壞的錶現;而魯棒設計 的結果對於輸入的擾動較小,對於輸入噪聲不敏感。
中間的圖中是對非魯棒和魯棒設計的 MVaR 集的說明,其中三角形錶示在輸入噪聲分布下,每個設計的 MVaR 集的離散近似。在沒有考慮噪聲的情况下,紫色 正方形可以對應更好的值;但是在加以擾動後其風險(MVaR)較大,難以做到對於輸入噪聲的魯棒。所以可以采用多變量風險值來刻畫解的穩定性。右圖是對不同風險集合的選擇策略的描述,假設方法給出了在三個目標上的 MVaR 集合,風險的最優集是不同目標 MVaR 集的並集上的最優點集。

背景
多目標優化在多個黑盒函數之間進行權衡,其目標是識別最優權衡的帕累托邊界和相應的最優設計的帕累托集 。考慮最大化黑盒函數: 其中 , 是目標個數, 是緊搜索空間。又上述定義可以引出帕累托支配和帕累托邊界的定義。若向量 帕累托支配於 ,記作 ,當且僅當 並且 滿足 。
帕累托最優(Pareto optimality)是一種不能再改進的狀態,不可能再改善某些個體或偏好准則而不使任何其他個體或准則受損。如果一種狀態存在帕累托最優的改進,那麼它被稱作受帕累托支配的。一種狀態如果是不受帕累托支配的,那麼它被稱作帕累托最優的或帕累托有效的,在優化問題中可以看作是最優點。這樣的最優點組成的集合被稱為帕累托邊界。從下圖中可以看出,A 和 B 是帕累托邊界上的點,其都是對於 C 的支配。

▲ 圖2:這裏給出帕累托邊界的一個例子。集合中的點錶示可行的選擇,這裏認為更小的值是更優的,紅線代錶帕累托邊界,其上面的樣本點均是帕累托有效的。點 C 同時被點 A 和點 B 支配,所以其不在帕累托邊界上。點 A 和點 B 不受任何其他點嚴格控制,因此比特於邊界上。
這裏定義 的帕累托邊界:

若 PARETO 中的元素滿足黑盒的附加約束,則將相應的最優設計集認為是帕累托邊界。而後,作者通過定義測度(超體積和超體積增量)來衡量不同帕累托邊界的質量,即帕累托邊界內部所包含區域的測度值。

方法
在這裏首先要對於風險進行定義。由於期望風險測量可能並不總是與真正魯棒性目標相一致,所以在這裏采用概率風險進行分析,並得到以下定義:

上面給出了風險價值的定義,其得到了在噪聲中 的一個下界 ,使得 有至少 的概率落在大於 的域內,並稱之為概率風險,以此對單目標的噪聲進行衡量。
而對於 Multivariate Value-at-Risk(MVaR)而言,所有的 個目標都是在相同的帶噪樣本中下進行評估的。作者在多目標的邊界進行設計其是不同目標的帕累托邊界,可以寫成下面的形式:


由此,其定義了跨越設計空間的全局風險,是采用一系列點(見圖 1 的三角形),在多目標情境下對於帕累托邊界的進行魯棒近似,這也是這篇文章的重要貢獻之一。

▲ 圖3:對於圖1中toy數據的MVaR的構建過程
本文提出了 MARS 方法,通過引入切比雪夫尺度化展示了 VaR 和 MVaR 間的關系,並可以對 MVaR 集合進行估計。這裏圖 3 是對圖 1 簡易數據的 MVaR 集合構建的過程,其中左圖中黑點錶示對於標准差為 0.1,均值為 0 的高斯輸入擾動的函數值,其背景是一個顯示跨越目標空間的切比雪夫尺度化值的輪廓。中間的圖給出了切比雪夫尺度化的概率密度和 的切比雪夫尺度化的風險值 ,黑線右側的概率質量等於 。右圖展示了通過文中所證明的定理構建出的關系,將 VaR 映射到 MVaR 中,綠色三角形代錶了來自輸入噪聲分布的 MVaR 集的離散近似。

主要結果

▲ 圖4:在4個不同噪聲數據集上的評估

▲ 圖5:雖然非魯棒設計在無噪聲目標(Nominal Values)下是可行的,但它比特於設計空間中可行區域的邊界附近,在輸入擾動的情况下會違反黑盒中的約束,使得得到的解不可行

▲ 錶1:不同算法的貝葉斯優化每次迭代的運行時間
圖 4 展示了隨訓練進程的變化,各個算法的性能錶現,這裏采用全局 MVaR 和設計 MVaR 的差距的 HV 的對數值作為評價指標,可以說明設計的 MVaR 能否接近全局情况。在輸入噪聲的幹預下,非魯棒方法顯著弱於魯棒方法,而作者的方法由於其他對比方法。圖 5 展示了在真實數據集中,選擇魯棒設計和非魯棒設計分別的收益。這裏可以看出通過 MVaR 學到的設計更接近於目標值,而非魯棒設計得到的解更可能落入非可行域中。錶 1 則展示了 MARS-based 方法在運行時間上的優勢。

總結與思考
在這篇工作中,作者結合了貝葉斯優化和多目標融合的性質,從分布層面來對於輸入噪聲進行了分析,其通過設計 MVaR 風險並尋找多目標風險的帕累托最優,很好的結合了兩個方法的特點,思路較為簡單合理。對於其他的多源目標的優化,比如多模態、多視角、多任務學習而言,該方法指導我們可以從數據擾動風險的角度入手,來分析方法中潜在的輸入噪聲問題。
同時,由於方法簡單但難以直觀錶述,作者用了較少篇幅就實現了對方法的清晰闡述,而後通過大量的鋪墊清晰闡述文章的背景和主要貢獻,並在附錄中給出了大量的證明說明了其中引理的正確性。同時,作者僅通過兩幅圖像即說明主要的問題和方法,清晰的展示出了多目標情境下的魯棒性問題。
而在方法層面,該方法采用一系列點對於分布邊界進行了估計,其與基於 anchor 的方法,通過錨點選取來估計數據分布的思想較為類似,二者分別描述了分布邊界和集散情况。後續可以對於噪聲(輸入噪聲、標簽噪聲)情况下二者的關系進行深入思考。
更多閱讀

#投 稿 通 道#
讓你的文字被更多人看到
如何才能讓更多的優質內容以更短路徑到達讀者群體,縮短讀者尋找優質內容的成本呢?答案就是:你不認識的人。
總有一些你不認識的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋梁,促使不同背景、不同方向的學者和學術靈感相互碰撞,迸發出更多的可能性。
PaperWeekly 鼓勵高校實驗室或個人,在我們的平臺上分享各類優質內容,可以是最新論文解讀,也可以是學術熱點剖析、科研心得或競賽經驗講解等。我們的目的只有一個,讓知識真正流動起來。
稿件基本要求:
• 文章確系個人原創作品,未曾在公開渠道發錶,如為其他平臺已發錶或待發錶的文章,請明確標注
• 稿件建議以 markdown 格式撰寫,文中配圖以附件形式發送,要求圖片清晰,無版權問題
• PaperWeekly 尊重原作者署名權,並將為每篇被采納的原創首發稿件,提供業內具有競爭力稿酬,具體依據文章閱讀量和文章質量階梯制結算
投稿通道:
• 投稿郵箱:[email protected]
• 來稿請備注即時聯系方式(微信),以便我們在稿件選用的第一時間聯系作者
• 您也可以直接添加小編微信(pwbot02)快速投稿,備注:姓名-投稿

△長按添加PaperWeekly小編
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
·

边栏推荐
- 北京内推 | 微软亚洲研究院机器学习组招聘NLP/语音合成等方向全职研究员
- [Jianzhi offer] 63 Maximum profit of stock
- Embedded-c Language-1
- mysql中取出json字段的小技巧
- 漫画:寻找股票买入卖出的最佳时机
- 云安全日报220705:红帽PHP解释器发现执行任意代码漏洞,需要尽快升级
- Is it safe to open futures accounts online? Will there be more liars online? Doesn't feel very reliable?
- [Web attack and Defense] WAF detection technology map
- C language to get program running time
- Practical example of propeller easydl: automatic scratch recognition of industrial parts
猜你喜欢

Browser rendering principle and rearrangement and redrawing

Application of threshold homomorphic encryption in privacy Computing: Interpretation

How to write a full score project document | acquisition technology

Machine learning 01: Introduction
MySQL queries the latest qualified data rows

Error in composer installation: no composer lock file present.

Judge whether a string is a full letter sentence

Judge whether a number is a prime number (prime number)
What are the precautions for MySQL group by

机器学习02:模型评估
随机推荐
[Jianzhi offer] 61 Shunzi in playing cards
stirring! 2022 open atom global open source summit registration is hot!
Machine learning 02: model evaluation
Complete solution instance of Oracle shrink table space
7.Scala类
[wechat applet] read the life cycle and route jump of the applet
Application of threshold homomorphic encryption in privacy Computing: Interpretation
Function sub file writing
这个17岁的黑客天才,破解了第一代iPhone!
Debug kernel code through proc interface
Understand the usage of functions and methods in go language
【性能测试】jmeter+Grafana+influxdb部署实战
winedt常用快捷键 修改快捷键latex编译按钮
漫画:一道数学题引发的血案
VBA驱动SAP GUI实现办公自动化(二):判断元素是否存在
漫画:有趣的【海盗】问题
MYSQL group by 有哪些注意事项
C language to get program running time
【jmeter】jmeter脚本高级写法:接口自动化脚本内全部为变量,参数(参数可jenkins配置),函数等实现完整业务流测试
WebApp开发-Google官方教程


