當前位置:外匯行情大全網 - 期貨行情 - 機器學習怎樣應用於量化交易

機器學習怎樣應用於量化交易

機器學習怎樣應用於量化交易(壹)

曾有朋友問過,國內現在量化領域機器學習應用的少,是否因為效果不如簡單的策略。其實,把機器學習應用在量化交易上始終面臨著兩難,卻並不是無解的兩難。很多時候並不是機器學習不work,而是真正懂如何用正確科學的統計思維使用Machine Learning的人才太少。

機器學習涉及到特征選擇、特征工程、模型選擇、數據預處理、結果的驗證和分析等壹整套建模流程,廣義角度來說就不單單是模型選擇的問題。所以,如果認為“用支持向量機成功預測股票漲跌” 這樣的研究,就是把機器學習應用於量化交易,這種狹義的認識無疑是買櫝還珠,對機器學習領域散落遍地的珍珠視而不見。如果把機器學習的崛起放在歷史進程中考量,無非就是趨勢的延續:現在,可通過系統的數據分析證實過去模糊不定的經驗,機器學習算法將未曾被察覺的規律得以浮現紙面。

在我看來,未來的發展概有兩個方向:

1.針對量化交易的統計學習算法被提出,使其適合於噪聲大,分布不穩定的金融數據分析;

2.對於機器學習的熱情回歸理性,從工具為導向回歸到問題為導向。

針對如何以問題為導向,在機器學習算法中挑選合適的工具,分享壹些思路。

1.多因子模型的因子權重計算

當我們在構建多因子模型且已經選定了壹系列因子之後,要如何根據不同的市場情況調整各個因子的權重呢?在以往的研究中發現,與其它算法相比較,隨機森林算法對於存在非線性、噪音和自變量***線性的訓練集的分析結果更出色。所以,目前在多因子模型的權重上,采用當期收益率對上期因子進行隨機森林回歸分析,以確定下壹期多因子模型的因子權重。

2.缺失值處理

處理缺失值在金融的量化分析中是個無可避免的問題。選取合理的缺失值處理方法,依賴於數據本身的特點、數據缺失的情況、其對應的經濟學意義,以及我們需要使用數據進行何種計算。在嘗試構建多因子模型時,我們選擇了兩種缺失值替換方法:(1)采用期望最大化算法?來用同壹變量的已知數據對缺失值進行極大似然估計。(2)把模型中包含的所有因子作為特征變量,並賦予其相同的權重,再采用機器學習中的K-近鄰算法來尋找最相似的標的,保證缺失值替換後,不會強化壹部分因子的影響力。

其實在量化領域,機器學習解決著線性模型天生的缺陷或弊端,所以還是有著很深的介入的。除去凸優化、降維(提取市場特征)等領域的應用,目前“非動態性”和“非線性”是兩個重要的弊端。金融關系之間並非靜態,很多時候也不是線性的。統計學習的優勢此時就會體現出來,它們能夠迅速地適應市場,或者用壹種更“準確的”方式來描述市場。

在國內,機器學習在量化內應用跟領域有很大的關系,跟頻率也有很大的關系。比如,CTA的運用可能就要多於股票,它處理數據的維度要遠小於股票,獲取市場的長度和動態又強於股票。股票市場的momentum要弱於期貨市場的momentum,它的趨勢與股票相比更明顯和低噪聲。這些特征對於機器學習發揮作用都更加有利。

很可能國內壹些交易執行算法的設計上就借鑒了機器學習。我們可以通過學習訂單薄特征,對下壹期盤口變化做壹些概率上的預測,經過壹定樣本的訓練之後,可以顯著地提升算法表現。

而我仍謹慎看好深度學習等機器學習方法的原因在於,在認識市場上,現行的大部分方法與這些方法並不在壹個維度上,這個優勢讓它們與其他方法相比,捕捉到更多的收益。也就是說,壹個新的認識市場的角度才能帶來alpha。

  • 上一篇:黃金和巴金有什麽區別?
  • 下一篇:嘉善星海實業有限公司怎麽樣?
  • copyright 2024外匯行情大全網