AI選股模型特征篩選與處理:SHAP、中性化與另類特征.pdf
- 上傳者:D***
- 時間:2024/09/11
- 熱度:306
- 0人點贊
- 舉報
AI選股模型特征篩選與處理:SHAP、中性化與另類特征。模型的特征工程研究。隨著機器學習模型在量化投資領域的廣泛應用,我們在此前的《Alpha掘金系列之九:基于多目標、多模型的機器學 習指數增強策略》、《Alpha掘金系列之十:機器學習全流程重構》和《ALPHA掘金系列之十二:排序學習對GRU選股 模型的增強》中,分別深入探討了結合樹模型和神經網絡模型的機器學習量化選股架構、模型訓練中的標簽選擇等細 節問題和新的排序學習框架的有效性。然而,對模型輸入端因子的特征工程尚缺乏系統的研究。本報告旨在填補這一 空白,探索幾個關鍵問題:特征選擇的必要性、宏觀數據與高頻數據等的加入是否有益,因子與標簽中性化處理的效 果。
通過對這些問題的深入探討和實證分析,我們得出了一系列重要結論:首先,基于 SHAP(Shapley Additive Explanations)的特征選擇方法顯著降低了模型訓練成本,并在一定程度上提升了GRU模型的精度,同時,SHAP提供 的可視化工具能夠直觀地展示各個因子的作用,為進一步優化模型提供了有價值的參考。相比之下,盡管基于簡單統 計方法的特征選擇方法也取得了一定效果,但深度學習特征選擇模塊STG的表現則不太理想。其次,關于另類因子的 引入,加入宏觀經濟數據和BARRA因子收益率等反映整體市場的另類因子,雖然能夠在一定程度上提升LightGBM 模 型的超額收益,但總體而言缺乏顯著的正向作用。引入高頻因子方面,在小微盤股上顯示出較高的有效性,而在大中 盤股上的應用方法仍需進一步探索。在因子與標簽中性化處理方面,將中性化處理后的標簽喂入LightGBM模型并與 原模型集成,能夠顯著優化模型的表現,然而,將因子中性化作為模型輸入的整體表現則不盡如人意。
改進后因子與策略效果
最終,我們在保持原框架一致性的基礎上,采用經過中性化標簽合成改進的GBDT模型和經過SHAP特征選擇改進的NN 模型,分別在不同成分股上進行測試,取得了顯著的樣本外效果。具體來說,在滬深300上,因子IC均值為11.91%, 多頭年化超額收益達22.92%,而多頭超額最大回撤為6.56%。在中證500上,因子IC均值為11.58%,多頭年化超額 收益率為12.35%。特別是在中證 1000 成分股上,因子表現尤為突出,IC 均值達到15.42%,多頭年化超額收益率為 25.42%,多頭超額最大回撤僅為4.42%。綜合這些結果,我們結合實際交易情況,構建了基于各寬基指數的指數增強 策略。其中,滬深300指數增強策略的年化超額收益達到15.83%,超額最大回撤為3.18%;中證500指數增強策略的 年化超額收益為18.23%,超額最大回撤為8.21%;而中證1000指數增強策略的年化超額收益則高達32.24%,超額最 大回撤為3.88%。這些結果表明,我們的方法在不同市場條件下均取得了顯著的超額收益和較低的回撤風險。
免責聲明:本文 / 資料由用戶個人上傳,平臺僅提供信息存儲服務,如有侵權請聯系刪除。
- 相關標簽
- 相關專題
- 全部熱門
- 本年熱門
- 本季熱門
- 金工對AI選股策略的探索與思考:機器能否在股票投資上全面取代人類?.pdf 308 6積分
- AI選股模型特征篩選與處理:SHAP、中性化與另類特征.pdf 307 6積分
- 房地產行業深度報告:基于量化分析與大模型的房地產股票AI選股系統.pdf 202 5積分
- 金融工程專題報告:基于知識蒸餾的AI選股模型優化.pdf 65 3積分
- 房地產行業深度報告:基于量化分析與大模型的房地產股票AI選股系統.pdf 202 5積分
- 金融工程專題報告:基于知識蒸餾的AI選股模型優化.pdf 65 3積分
- 金融工程專題報告:基于知識蒸餾的AI選股模型優化.pdf 65 3積分
