当前位置：网站首页>ICML 2022 | Meta提出魯棒的多目標貝葉斯優化方法，有效應對輸入噪聲

ICML 2022 | Meta提出魯棒的多目標貝葉斯優化方法，有效應對輸入噪聲

2022-07-05 17:24:00 【PaperWeekly】

作者 | 楊澤群

單比特 | 中國人民大學

研究方向 | 多模態學習

論文標題：

Robust Multi-Objective Bayesian Optimization Under Input Noise

論文鏈接：

https://arxiv.org/abs/2202.07549

項目鏈接：

https://github.com/facebookresearch/robust_mobo

本文是 facebook 發錶於 ICML 2022 的一篇工作，其在理論角度上對有輸入噪聲的多目標貝葉斯優化進行了分析。

引言

本文面向多目標優化的輸入噪聲問題，結合貝葉斯優化和帕累托最優的思想設計並優化了全局多目標風險價值，以解决對輸入噪聲敏感的黑盒約束的問題。貝葉斯優化通過調整設計參數，可以優化高評估成本的黑盒性能指標。雖然現有很多方法被提出用於在輸入噪聲下優化單一目標，但目前仍然缺少能够解决存在多個目標對輸入擾動敏感的實際問題的方法。

在這項工作中，作者提出了第一個魯棒的多目標貝葉斯優化方法以應對輸入噪聲。作者將目標形式化為優化一種不確定目標的風險度量，即多變量風險值（MVaR）。由於直接優化 MVaR 在許多情况下在計算上是不可行的，作者提出了一種可擴展的、基於理論的方法來使用隨機尺度來優化 MVaR。實驗上而言，該方法在數據集上顯著優於其他方法，並有效地實現了最優魯棒設計。

▲ 圖1：簡易數據集上錶明非魯棒設計的多目標優化的最優值對輸入噪聲敏感，並給出了最優點集的選取演示。

這裏通過圖 1 來梳理一下作者提出的問題：左圖中，非魯棒設計（紫色）和魯棒設計（綠色）的標稱值使用正方形錶示。加號標記錶示每個設計在零均值高斯輸入噪聲下的目標值，標准差為 0.1。可以看到，雖然非魯棒設計可能會獲得局部較優的結果，但是其在輸入擾動下的不穩定，容易導致更壞的錶現；而魯棒設計的結果對於輸入的擾動較小，對於輸入噪聲不敏感。

中間的圖中是對非魯棒和魯棒設計的 MVaR 集的說明，其中三角形錶示在輸入噪聲分布下，每個設計的 MVaR 集的離散近似。在沒有考慮噪聲的情况下，紫色正方形可以對應更好的值；但是在加以擾動後其風險（MVaR）較大，難以做到對於輸入噪聲的魯棒。所以可以采用多變量風險值來刻畫解的穩定性。右圖是對不同風險集合的選擇策略的描述，假設方法給出了在三個目標上的 MVaR 集合，風險的最優集是不同目標 MVaR 集的並集上的最優點集。

背景

多目標優化在多個黑盒函數之間進行權衡，其目標是識別最優權衡的帕累托邊界和相應的最優設計的帕累托集。考慮最大化黑盒函數：其中，是目標個數，是緊搜索空間。又上述定義可以引出帕累托支配和帕累托邊界的定義。若向量帕累托支配於，記作，當且僅當並且滿足。

帕累托最優（Pareto optimality）是一種不能再改進的狀態，不可能再改善某些個體或偏好准則而不使任何其他個體或准則受損。如果一種狀態存在帕累托最優的改進，那麼它被稱作受帕累托支配的。一種狀態如果是不受帕累托支配的，那麼它被稱作帕累托最優的或帕累托有效的，在優化問題中可以看作是最優點。這樣的最優點組成的集合被稱為帕累托邊界。從下圖中可以看出，A 和 B 是帕累托邊界上的點，其都是對於 C 的支配。

▲ 圖2：這裏給出帕累托邊界的一個例子。集合中的點錶示可行的選擇，這裏認為更小的值是更優的，紅線代錶帕累托邊界，其上面的樣本點均是帕累托有效的。點 C 同時被點 A 和點 B 支配，所以其不在帕累托邊界上。點 A 和點 B 不受任何其他點嚴格控制，因此比特於邊界上。

這裏定義的帕累托邊界：

若 PARETO 中的元素滿足黑盒的附加約束，則將相應的最優設計集認為是帕累托邊界。而後，作者通過定義測度（超體積和超體積增量）來衡量不同帕累托邊界的質量，即帕累托邊界內部所包含區域的測度值。

方法

在這裏首先要對於風險進行定義。由於期望風險測量可能並不總是與真正魯棒性目標相一致，所以在這裏采用概率風險進行分析，並得到以下定義：

上面給出了風險價值的定義，其得到了在噪聲中的一個下界，使得有至少的概率落在大於的域內，並稱之為概率風險，以此對單目標的噪聲進行衡量。

而對於 Multivariate Value-at-Risk（MVaR）而言，所有的個目標都是在相同的帶噪樣本中下進行評估的。作者在多目標的邊界進行設計其是不同目標的帕累托邊界，可以寫成下面的形式：

由此，其定義了跨越設計空間的全局風險，是采用一系列點（見圖 1 的三角形），在多目標情境下對於帕累托邊界的進行魯棒近似，這也是這篇文章的重要貢獻之一。

▲ 圖3：對於圖1中toy數據的MVaR的構建過程

本文提出了 MARS 方法，通過引入切比雪夫尺度化展示了 VaR 和 MVaR 間的關系，並可以對 MVaR 集合進行估計。這裏圖 3 是對圖 1 簡易數據的 MVaR 集合構建的過程，其中左圖中黑點錶示對於標准差為 0.1，均值為 0 的高斯輸入擾動的函數值，其背景是一個顯示跨越目標空間的切比雪夫尺度化值的輪廓。中間的圖給出了切比雪夫尺度化的概率密度和的切比雪夫尺度化的風險值，黑線右側的概率質量等於。右圖展示了通過文中所證明的定理構建出的關系，將 VaR 映射到 MVaR 中，綠色三角形代錶了來自輸入噪聲分布的 MVaR 集的離散近似。

主要結果

▲ 圖4：在4個不同噪聲數據集上的評估

▲ 圖5：雖然非魯棒設計在無噪聲目標（Nominal Values）下是可行的，但它比特於設計空間中可行區域的邊界附近，在輸入擾動的情况下會違反黑盒中的約束，使得得到的解不可行

▲ 錶1：不同算法的貝葉斯優化每次迭代的運行時間

圖 4 展示了隨訓練進程的變化，各個算法的性能錶現，這裏采用全局 MVaR 和設計 MVaR 的差距的 HV 的對數值作為評價指標，可以說明設計的 MVaR 能否接近全局情况。在輸入噪聲的幹預下，非魯棒方法顯著弱於魯棒方法，而作者的方法由於其他對比方法。圖 5 展示了在真實數據集中，選擇魯棒設計和非魯棒設計分別的收益。這裏可以看出通過 MVaR 學到的設計更接近於目標值，而非魯棒設計得到的解更可能落入非可行域中。錶 1 則展示了 MARS-based 方法在運行時間上的優勢。

總結與思考

在這篇工作中，作者結合了貝葉斯優化和多目標融合的性質，從分布層面來對於輸入噪聲進行了分析，其通過設計 MVaR 風險並尋找多目標風險的帕累托最優，很好的結合了兩個方法的特點，思路較為簡單合理。對於其他的多源目標的優化，比如多模態、多視角、多任務學習而言，該方法指導我們可以從數據擾動風險的角度入手，來分析方法中潜在的輸入噪聲問題。

同時，由於方法簡單但難以直觀錶述，作者用了較少篇幅就實現了對方法的清晰闡述，而後通過大量的鋪墊清晰闡述文章的背景和主要貢獻，並在附錄中給出了大量的證明說明了其中引理的正確性。同時，作者僅通過兩幅圖像即說明主要的問題和方法，清晰的展示出了多目標情境下的魯棒性問題。

而在方法層面，該方法采用一系列點對於分布邊界進行了估計，其與基於 anchor 的方法，通過錨點選取來估計數據分布的思想較為類似，二者分別描述了分布邊界和集散情况。後續可以對於噪聲（輸入噪聲、標簽噪聲）情况下二者的關系進行深入思考。

更多閱讀