深圳2020年7月15日 /美通社/ -- 近期,大巖資本成立七周年慶在深圳成功舉辦。周年慶上量化投資基金經(jīng)理黃鉑博士結(jié)合生活實(shí)踐中的案例,深入淺出闡釋了最優(yōu)化算法的前世今生。
從實(shí)際生活中最基礎(chǔ)的應(yīng)用切入,黃鉑博士將抽象的算法概念生動化,解釋了什么叫最優(yōu)化問題、凸優(yōu)化及算法分類、機(jī)器學(xué)習(xí)與人工智能應(yīng)用。
黃博士的分享內(nèi)容較長,我們將分上、中、下三篇連載推出,本文為上篇。
最優(yōu)化問題及基礎(chǔ)應(yīng)用
人生不如意之事十之八九,想達(dá)到我們想要達(dá)到的目標(biāo)時,通常都有各種各樣的限制。那么所謂最優(yōu)化問題,就是指用最優(yōu)的方式去平衡理想與現(xiàn)實(shí)之間的關(guān)系。以簡單的郵差送信問題為例,郵差從A出發(fā),送信到BCD,最后回到A。郵差每天必須經(jīng)過BCD,而且每個點(diǎn)每天只能經(jīng)過一次,在這樣的約束條件下,他的目標(biāo)函數(shù)是盡可能以最短的時間完成送信。這個問題非常簡單,只要把所有的路徑枚舉出來,然后取最短時間的方式即可。
根據(jù)前面的例子,我們嚴(yán)格的將目標(biāo)函數(shù)分為兩大類。第一類是最大化,包括最大化盈利,最大化效率。另一類是最小化,包括最小化費(fèi)用、時間和錯誤率。在金融行業(yè),我們可以最大化預(yù)測股價的正確率,也可以最小化費(fèi)用、最小化時間和錯誤率。當(dāng)然,我們可以同時最大化盈利,最小化費(fèi)用和時間。所以通常在很多的優(yōu)化問題中,這兩種任務(wù)可以組合起來出現(xiàn)在同一個問題框架下,這就是對于目標(biāo)函數(shù)的定義。
最優(yōu)化問題的兩大類:連續(xù)優(yōu)化與離散優(yōu)化
關(guān)于約束條件,理想很美好,現(xiàn)實(shí)很骨感,在現(xiàn)實(shí)生活中,我們會遇到比如預(yù)算有限、時間有限、外部強(qiáng)制性條件等各種各樣的問題,與目標(biāo)函數(shù)一樣,這些限制條件不是單一存在的,也可能同時存在同一個問題里,對于某一個優(yōu)化問題來講,限制條件越復(fù)雜,求解就越困難?;诖耍覀兒唵胃鶕?jù)它的約束條件以及目標(biāo)函數(shù)變量類型將最優(yōu)化問題分成兩大類,連續(xù)優(yōu)化和離散優(yōu)化。
連續(xù)優(yōu)化正如圖上所畫,線中間沒有斷點(diǎn),而離散優(yōu)化的變量取值,是一個不連續(xù)的記錄,就如同一開始講的郵差送信問題。兩類相較而言,離散優(yōu)化會更難解決,因?yàn)殡x散優(yōu)化多了一條限制條件 -- 不連續(xù)的集合。很多時候,我們要求我們的變量是一個整數(shù),或者來自一個給定的區(qū)間,所以說離散優(yōu)化會比連續(xù)優(yōu)化更難解,而兩種算法也會有非常大的不一樣。
從學(xué)術(shù)角度而言,連續(xù)優(yōu)化與離散優(yōu)化對應(yīng)的是兩個比較獨(dú)立的學(xué)科,離散優(yōu)化可能更多的應(yīng)用于統(tǒng)計(jì)、大數(shù)據(jù)相關(guān)的場景,連續(xù)優(yōu)化則會跟計(jì)算機(jī)密碼學(xué)相關(guān),更多的與我們現(xiàn)實(shí)生活中的運(yùn)籌優(yōu)化應(yīng)用相關(guān)。
從目標(biāo)函數(shù)出發(fā),它的最優(yōu)值也分為兩類,局部最優(yōu)和全局最優(yōu)。我們看圖中黃色的點(diǎn),在局部區(qū)域內(nèi)是最低的,我們管這個值叫做局部最優(yōu)值,但是當(dāng)我們看整個圖時,紅色的點(diǎn)才是最低的,所以這個點(diǎn)我們叫全局最優(yōu)值。通常來說,取局部最優(yōu)值是相較容易的,因?yàn)榛旧夏阒恍枰此R近一小部分的信息就可以準(zhǔn)確判斷是否局部最優(yōu),而在現(xiàn)實(shí)應(yīng)用中,其實(shí)僅僅知道局部最優(yōu)值就足以解決很多問題。而更難的問題在于全局最優(yōu)值,因?yàn)榍疤崾悄阈枰吹秸麄€畫面。
所以,對于這一類問題,我們目前沒有一個特別好的解決方法。現(xiàn)實(shí)生活中,我們會有比較多的方法去求局部最優(yōu)值,而往往我們找到的幾乎跟實(shí)際上的全局最優(yōu)值不一樣。但有一個問題是例外,這類問題它具有比較好的性質(zhì),只要找到局部最優(yōu)值,它就肯定是全局最優(yōu)值,這類問題就叫凸優(yōu)化。(未完待續(xù))