如果你對銀行與金融領域的 AI 應用有興趣的話,你肯定了解 JPM(摩根大通)最近十年對大數(shù)據(jù)和人工智能的出色運用,也會對他們最新發(fā)布的一份報告感興趣。
JPM(摩根大通) 一直是銀行金融行業(yè)中積極應用大數(shù)據(jù)和人工智能技術的典范和先行者。今年五月,他們在 NIPS 上提交了一份題目為 Idiosyncrasies and challenges of data driven learning in electronic trading 的報告(其實是一篇小論文)。不過直至最近,內(nèi)容才得以對外公布。這篇并不長的文章中,他們探討了算法交易中機器學習等技術的應用情況,也分享了摩根大通的最新經(jīng)驗。
去年那份巨長的報告出自 Marko Kolanovic 之手,素有「半人半神」之稱的 Marko Kolanovic 是 JPM 宏觀量化研究團隊負責人。另外一位合作者是去年四月剛從美林銀行離職的量化策略師 Rajesh Krishnamachari。
不過,這篇報告并沒那么長,共由五位 JPM 員工共同完成。他們分別是 Vacslav Glukhov(EMEA 電子交易量化研究中心負責人)、Vangelis Bacoyannis(電子交易定量研究中心副總裁)、Tom Jin(量化分析師)、Jonathan Kochems(量化研究員)及 Doo Re Song(量化研究員)。
2018 年 5 月,我們就在神經(jīng)信息處理系統(tǒng)大會(NIPS conference)上提交過這份報告,不過直到最近才得以公開。想知道如何將「數(shù)據(jù)驅(qū)動的機器學習」用于算法交易的朋友們請注意了,報告概要如下:
如今算法控制關鍵交易決策,客戶設置部分參數(shù)
算法在金融業(yè)務中控制「微觀層」的交易,如股票和電子期貨合約:「算法決定交易的波段、價格及數(shù)量。」然而,算法并不會完全按照人們的預期工作。JPM 提醒客戶,「算法通常只是把具體約束及偏好下的交易指令告訴經(jīng)紀人。」
例如,客戶可能想在投資組合時保持貨幣中立,以實現(xiàn)買賣數(shù)量大體相等。客戶也可能會指定某組交易證券的主題、國家或行業(yè)。
客戶下單交易時,他們也許想控制交易執(zhí)行對市場價格影響的方式(操控市場影響)、或控制市場波動影響交易的方式(控制風險)、或指定一個能夠平衡市場影響與風險的緊急程度。
交易委托賬本包含的數(shù)據(jù)十分復雜
編寫電子交易算法是一件讓人抓狂且十分復雜的任務。
舉個例子。JPM 分析師指出,一局國際象棋每人大約要走 40 步,一局圍棋大約走 200 步。然而,即便是中等交易頻率的電子交易算法(每秒都需要重新考慮交易選擇)每小時大約要完成 3600 次交易選擇。
問題遠不止于此。當繪制國際象棋與圍棋數(shù)據(jù)時,如何在所有可選項中選擇走哪一步、下一步又該如何應對,這都是需要解決的問題。然而,一次電子交易行為包括了許多步驟。JPM 分析師認為「這就是一個子訂單(child order)集合。」
什么是子訂單(child order)?JPM 解釋道,系指可能會「提交被動買入訂單和主動買入訂單」的單次(single)交易。被動子訂單是交易委托賬本中指定價位水平的交易,因此,能為其它市場參與者提供流動性。提供流動性可能最終通過抓住局部上漲趨勢,在交易時獲得回報:更好的交易價格,或者更好的交易對象。另一方面,主動子訂單會被用來基于預期的價格變動,捕捉交易良機。上述兩種情況都會產(chǎn)生單次(single)交易行為。最終,交易行為范圍被無限擴大,根據(jù)瞬時交易特征的組合數(shù)量呈指數(shù)增長。
誠然如是。
人工編寫的交易算法容易變得龐大而笨拙
人工編寫電子交易算法時,情況會迅速變得復雜。
過去,JPM 分析師認為:電子交易算法融合了許多科學的量化模型;量化模型是「從定量角度描述世界的運行機制」;算法包含著「代表交易員和算法使用者的實踐經(jīng)驗、觀察結論和風險偏好的規(guī)則和啟發(fā)式方法。」
想把算法的方方面面都說清楚是十分困難的。「多數(shù)人編寫的算法代碼冗長至極且難于維護及修改。」JPM 認為,每當客戶目標及市場條件變化時,人工算法都深感「功能拓展」之難。
隨著時間的推移,算法將學會「積累多層邏輯、參數(shù)及微調(diào),以處理特殊情況。」
監(jiān)管讓人工編寫的算法再次變得更加復雜
此外,交易算法還必須應對諸如 MiFID II(新版歐盟金融工具市場指導)的監(jiān)管及「最優(yōu)執(zhí)行」的理念。因此,算法編寫必須考慮「變化發(fā)展的市場條件與結構、監(jiān)管約束及客戶的多重目標與不同偏好。」
如果算法編寫實現(xiàn)自動化且滿足各類約束,一切都將變得簡單。
編寫交易算法時,使用數(shù)據(jù)的三種文化手段(cultural approaches)
機器學習文化嘗試運用更多復雜且有時晦澀的函數(shù)表達觀測結果,不要求函數(shù)能揭示潛在流程的本質(zhì)。
算法決策文化更關注于決策,而非建模。算法決策文化嘗試訓練電子代理(譬如算法)以區(qū)分決策好壞,而不是試圖映射出世界運行機制。如此一來,理解算法為何做出決策,及如何利用規(guī)則、價值及約束確保決策可被接受就成為新的問題。
算法必須實現(xiàn)最優(yōu)執(zhí)行率與最優(yōu)執(zhí)行計劃之間的平衡
算法一旦寫完,首先需要解決平衡問題:快速交易,其風險是影響市場價格;慢速交易,其風險是成交價格變化或?qū)⒁鸾灰讚p失(升了,買家賺錢;跌了,賣家賺錢)。
是什么構成了成功交易?并非總是清晰可見
算法交易成功與否很難界定,因為這與如何權衡快速交易(效率)與固定價格交易(最優(yōu))有關──而這又取決于客戶如何設定他的優(yōu)先等級。
例如,算法的目標可能是與市場其他部分融合(blend with the rest of the market)。這意味著,需要平衡極速交易與價格變動引起的市場影響、或是通過慢速交易確保價格與交易反向。算法編寫人員需要尋找一種表達信息和行為的方式,該方式能與模型與機器學習方法相匹配。盡管「市場龐大、多變,規(guī)模和訂單狀態(tài)經(jīng)常變化,父訂單與子訂單數(shù)還不夠作為模型輸入。」,市場狀態(tài)都需要能被總結和概括出來。
不過,這也無助于抓住瞬即逝的絕佳機會。而且,JPM 認為,算法交易執(zhí)行或取消后,就無法判斷交易的好壞,但這一點并非總是那么顯而易見。「局部最優(yōu)并不需要轉變成全局最優(yōu)。現(xiàn)在失敗的交易也許以后某天又會賺的盆滿缽滿。」
即便可能出現(xiàn)問題,JPM 已經(jīng)開始使用強化學習算法處理交易
JPM 正急于掌握運用動態(tài)規(guī)劃及獎懲機制的各種強化學習算法。
JPM 交易員說,「我們目前使用第二代基于強化算法的限價委托引擎,于有界行為空間內(nèi)訓練算法,選擇具備差異化獎勵、步長及時程特征的短期目標。」然而,訓練算法十分復雜──如果你嘗試通過在多重處理設備上同時執(zhí)行算法以實現(xiàn)算法的平行訓練,會得到錯誤結果。原因是算法與環(huán)境之間的閉環(huán)反饋。但如果你不這么做,而嘗試基于梯度的算法訓練,最終會得到大量無關經(jīng)驗,無法記住好的交易行為。
JPM 嘗試應用超參數(shù)優(yōu)化技術避免此問題。這代表每次訓練都有多個抽樣事件,并會盡早停止無意義的優(yōu)化路徑。銀行應用超參數(shù)優(yōu)化技術,通過運行平行訓練項目訓練算法。
JPM 表示,研究的主要目標已轉變?yōu)椤覆呗詫W習算法」,通過在固定參數(shù)條件下匹配特定商業(yè)目標以最大化累積報酬。分層強化學習可用于要求必須「生成可預測、可控制及可解釋行為」的交易算法。在分層方法中,根據(jù)抽樣頻率和粒度水平將算法決策劃分為不同組別,使得算法能夠模塊化,其求解效果也容易甄別。
JPM 已開發(fā)具備「某種特征」的強化學習算法,以應對長尾效應
在多數(shù)強化學習情況中,JPM 強調(diào)算法學習行為通常會產(chǎn)生更好的結果。然而,在金融業(yè),過度關注平均結果是錯誤的──想想長尾效應。基于此原因,銀行的量化專家始終基于多維度與不確定結果評價構建算法。
為實現(xiàn)該目標,銀行會基于期望效用的未來分布對比結果,對不確定結果(長尾)排序──即 CERL(確定等值強化學習)。
通過 CERL,JPM 注意到算法能夠有效獲得基于風險偏好的特性。「如果客戶是風險厭惡,結果的不確定增加會降低行為的確定等值獎勵。」算法很自然的需要折扣因素 γ──代表結果分布,分布范圍與風險正相關。算法將更加關注遠期目標。
-
人工智能
+關注
關注
1799文章
47965瀏覽量
241277 -
機器學習
+關注
關注
66文章
8458瀏覽量
133233
原文標題:如何在算法交易中使用AI?摩根大通發(fā)布新版指南
文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
機器學習模型市場前景如何
AN3408-如何將12位ADC用于力敏電阻

傳統(tǒng)機器學習方法和應用指導

NPU與機器學習算法的關系
LIBS結合機器學習算法的江西名優(yōu)春茶采收期鑒別

如何將 THVD8000 應用于星型網(wǎng)絡系統(tǒng)

【「時間序列與機器學習」閱讀體驗】全書概覽與時間序列概述
如何將精益思維應用于傳統(tǒng)工廠的數(shù)字化轉型?
利用Matlab函數(shù)實現(xiàn)深度學習算法
機器學習算法原理詳解
機器學習在數(shù)據(jù)分析中的應用
名單公布!【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來?
機器學習怎么進入人工智能
傅里葉變換基本原理及在機器學習應用

評論