淺談SciPy中的optimize.minimize實(shí)現(xiàn)受限優(yōu)化問題
問題描述:有一批樣本x,每個(gè)樣本都有幾個(gè)固定的標(biāo)簽,如(男,24歲,上海),需要從中抽取一批樣本,使樣本總的標(biāo)簽比例滿足分布P(x),如(男:女=49%:51%、20歲:30歲=9%:11%、..........)
采用KL-散度作為優(yōu)化目標(biāo)函數(shù)。
KL-散度又叫相對熵
KL-散度在機(jī)器學(xué)習(xí)中,P用來表示樣本的真實(shí)分布,比如[1,0,0]表示當(dāng)前樣本屬于第一類。Q用來表示模型所預(yù)測的分布,比如[0.7,0.2,0.1]
KL-散度直觀的理解就是如果用P來描述樣本,那么就非常完美。而用Q來描述樣本,雖然可以大致描述,但是不是那么的完美,信息量不足,需要額外的一些“信息增量”才能達(dá)到和P一樣完美的描述。如果我們的Q通過反復(fù)訓(xùn)練,也能完美的描述樣本,那么就不再需要額外的“信息增量”,Q等價(jià)于P。
公式:

使用SciPy中的optimize.minimize來進(jìn)行優(yōu)化。
def minimize(fun, x0, args=(), method=None, jac=None, hess=None,
hessp=None, bounds=None, constraints=(), tol=None,
callback=None, options=None):
幾個(gè)重要的參數(shù):
fun:目標(biāo)函數(shù)(he objective function to be minimized);
x0:參數(shù)初始值(Initial guess. Array of real elements of size (n,));
bounds:參數(shù)取值范圍限制(Bounds on variables for L-BFGS-B, TNC, SLSQP and trust-constr methods.)
constraints:約束函數(shù)(Constraints definition (only for COBYLA, SLSQP and trust-constr)
Constraints for COBYLA, SLSQP are defined as a list of dictionaries. Each dictionary with fields: type : str Constraint type: 'eq' for equality, 'ineq' for inequality. fun : callable The function defining the constraint. jac : callable, optional The Jacobian of `fun` (only for SLSQP). args : sequence, optional Extra arguments to be passed to the function and Jacobian. )
tol : 目標(biāo)函數(shù)誤差范圍,控制迭代結(jié)束(optional Tolerance for termination. For detailed control, use solver-specific options.) options : 其他一些可選參數(shù)(dict, optional A dictionary of solver options. All methods accept the following generic options:)
求解過程:
定義優(yōu)化函數(shù):
def obj_function(x): 其中x為要優(yōu)化的變量,在本問題中有480類的樣本(如:男,24歲,上海),每類樣本10-1000個(gè)不等,x為每類抽取的比例。要從中抽取50000個(gè)樣本,滿足22個(gè)約束條件(男:女=50%:50%、20歲:30歲=9%:11%等等)。
例如:男性要占總樣本的50%,則 
選擇優(yōu)化函數(shù)。SciPy中可以使用bounds參數(shù)的算法有:L-BFGS-B, TNC, SLSQP and trust-constr,可以使用constraints 參數(shù)的算法有: COBYLA, SLSQP and trust-constr
調(diào)參:optimize.minimize有統(tǒng)一的參數(shù),但每個(gè)優(yōu)化算法都有自己特有的參數(shù),可以看源碼中的參數(shù)列表。
運(yùn)行:res = optimize.minimize(sample_fun, np.array(x0), bounds=bound, method='L-BFGS-B', tol=1e-11, options={'disp': True, 'maxiter': 300, 'maxfun': 1500000}),最終的結(jié)果保存在res.x中
如果程序沒達(dá)到指定的迭代次數(shù)就停止,可能有兩種原因:
STOP: TOTAL NO. of f AND g EVALUATIONS EXCEEDS LIMIT 增大參數(shù)maxfun;
CONVERGENCE: REL_REDUCTION_OF_F_<=_FACTR*EPSMCH 調(diào)小參數(shù)tol
以上這篇淺談SciPy中的optimize.minimize實(shí)現(xiàn)受限優(yōu)化問題就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
對TensorFlow中的variables_to_restore函數(shù)詳解
今天小編就為大家分享一篇對TensorFlow中的variables_to_restore函數(shù)詳解,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-07-07
Python向Excel中插入圖片的簡單實(shí)現(xiàn)方法
這篇文章主要介紹了Python向Excel中插入圖片的簡單實(shí)現(xiàn)方法,結(jié)合實(shí)例形式分析了Python使用XlsxWriter模塊操作Excel單元格插入jpg格式圖片的相關(guān)操作技巧,非常簡單實(shí)用,需要的朋友可以參考下2018-04-04
使用C#配合ArcGIS Engine進(jìn)行地理信息系統(tǒng)開發(fā)
這篇文章主要介紹了使用C#配合ArcGIS Engine進(jìn)行地理信息系統(tǒng)開發(fā),ArcGIS Engine是Windows系統(tǒng)上可以讓程序員創(chuàng)建自定義的GIS桌面程序,需要的朋友可以參考下2016-02-02
Python調(diào)用C語言的實(shí)現(xiàn)
這篇文章主要介紹了Python調(diào)用C語言的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07

