人工智能之金融量化分析實戰

0 評論 936 瀏覽 4 收藏 13 分鐘

金融是一個相對復雜的體系,而人工智能金融量化分析,更是一個復雜的系統工程。怎么解讀這項工程呢?這篇文章里,作者嘗試總結了金融資產進行量化分析的一套方法,以真實數據作為實戰的基礎數據進行模型搭建,一起來看。

金融是一個非常復雜的體系,客觀反映了社會運行的狀況,金融市場的數據指標也是社會經濟的晴雨表。對于金融的量化分析,可以從微觀和宏觀兩個方面進行。微觀注重個體,宏觀代表趨勢。

本文主要是通過對金融領域中某種資產數據指標進行匯總,從宏觀上探究其規律,從而實現計算機對資產價格進行智能預測。

既然是實戰,本文采用資本二級市場公開的真實數據作為實戰的基礎數據進行模型搭建。對于實戰結果,僅作為分析參考,并不構成投資建議。

對于AI(ArtificialIntelligence,人工智能)領域而言,是個非常龐大且復雜的系統工程,涉及非常多的基礎知識,人工智能離不開數據標注,也離不開特征工程,依賴于機器學習,又依賴于深度學習,同時又涉及非常多的人工智能工具和機器學習的框架。

我們知道,機器學習最常見最基礎的的分類是監督學習(SupervisedLearning)、無監督學習(UnsupervisedLearning)和半監督學習(Semi-SupervisedLearning)。

  • 監督學習:在給定的數據標簽中給新數據打標。
  • 無監督學習:給定數據類別未知,通過機器自動分類,進行標注。
  • 半監督學習:有些數據有標簽,有些數據無標簽,機器進行分類。

實現人工智能的前提,在于能將場景數字化,從而可以進行量化分析,并智能執行某些策略??梢院唵卫斫鉃榻o定若干輸出,讓計算機給出輸出,以數學的視角進行觀測,其實是在事物與機器之間建立一個函數關系。

我們看到一個小孩,預測這個小孩將來能長多高,通過經驗判斷,往往是看小孩子的父母身是多少。父母的身高,其實就是一個輸入的指標,對小孩身高的預測,就是輸出的結果。

為了提高預測的準確性,我們可以增加多個輸入的指標,例如:小孩的營養狀況,體育鍛煉情況,小孩家族其他長輩們的身高等指標。

人工智能對于金融的量化分析,我們也可以采用這種思路,將金融資產的各項指標進行定義,通過對現有數據多維度的指標作為輸入條件,現有數據多維度指標對應的輸出結果進行機器學習,建立數據模型,然后將新的金融多維數據作為參數輸入,由人工智能引擎結合數據模型給出相應的結果輸出。

金融量化模型構建基礎邏輯,就是選取相近的金融資產,根據這些相近的金融資產各項基礎數據為機器學習樣本,最后通過輸入一個新的金融資產,來通過其各項指標預測輸入金融資產具備的價值。主要過程如下。

1)建立指標。我們首先建立對金融資產進行量化分析的指標,本文中,我們可以建立的指標主要如下。當然實際分析中,我們也可以選擇其他維度的指標進行補充。通過對機器學習結果的評價,以及模型的不斷調整,從而選取更優秀的指標,從而提升機器學習的質量。

2)數據準備。有了以上指標,我們對相似的資產進行數據準備??紤]到篇幅限制,為了在一個頁面中顯示的數據清晰些,指標我們做一些精減,精減后的數據樣例如下。機器學習的基礎數據是第2行之后的數據,之后我們通過輸入第2行的參數,來預測【上海臨港】的資產價格。

在選取機器學習數據時,我們盡可能的選擇量化分析同類型的資產數據,例如本文的實戰中想預測【上海臨港】資產的價格,我們要找同【上海臨港】相近的資產標的?!旧虾ER港】屬于房地產業,而且又屬于國資改革、園區開發、創投等概念題材。

我們可以根據策略,獲取彼此相近的全量數據,之后我們再對全是數據進行優選,這個評價的過程,類似于比賽中的評委評分,去掉一個最高分,去掉一個最低分,例如,我們選取的數據中,市盈率和其他數據的市盈率偏差非常大的,我們也可以舍去。當然實際過程還有很多影響因子,需要具體情況具體分析。

3)工具準備。本次機器學習使用的工具是Spyder,通過Python語言實現。Python相關環境的搭建比較基礎,在這里不做太多講解,大家直接下載一個ANACONDA開發工具即可。

當然,大家如果習慣使用其他機器學習的工具,也可以采用其他的,只要方便的就可以,基礎原理其實都是一樣的。

4)數據整理。我們開始以準備好的數據文件為樣例讀入,并進行數據整理,為后續機器學習做準備。

我們可以查看導入的數據,來檢查導入的數據是否有遺漏。

之后,我們將導入的數據進行整理,去掉【資產名稱】和【資產代碼】,因為這些數據在我們的機器學習過程中無使用價值。整理后的數據,如下所示。

5)機器學習。接下來我們對已有的樣本數據進行機器學習,機器學習模型有很多,本文使用比較簡單的線性回歸模型進行機器學習。在項目中引入Sklearn,受于篇幅限制Sklearn詳細用法,大家可以在網上查閱相關資料。

6)結果預測。我們將對【上海臨港】資產價格進行預測,其基本的指標如下。

將以上指標作為輸入條件錄入機器學習模型中,生成結果。

預測結果:

根據機器學習相當數據后,對【上海臨港】資產預測是【13.19元】,也就意味著結合與其相似的資產的現狀,給出【上海臨港】在當前背景下,資金價格應該值【13.19元】。

我們看了一下【2024年1月31日11:30】這個時點的【上海臨港】的價格為【10.11元】,這說明在當前背景下,【上海臨港】的價格相對于同類資產,其實是低估的,仍然有一定的增長空間。

雖然我們在本次人工智能金融量化分析實戰使用的是真實的金融數據,但是由于數據樣本量太少,機器學習的結論可能精度不夠。我們使用的機器學習模型也比較單一,我們可以結合更多的機器學習模型,來提升機器學習的質量。

機器學習的過程也需要依賴非常多的基礎條件才能不斷提升機器學習效果,需要海量的數據,也需要不斷對指標和模型進行調優,以及結合各種評價方法,使得機器學習的結論可以邏輯自洽。

對于本文而言,最大的價值在于我們建立了一個對金融資產進行量化分析的簡單方法。在此方法基礎上,我們可以結合更多的數據以及指標,來使得機器學習的結果更為精準。

在此基礎上,構建一個金融人工智能的平臺,對其他資產進行實時快速預測從而判斷當前的資產價格是高估還是低估,以及是否有投資的空間。從而進一步作為計算機交易的參考因子,結合其他量化模型,給出決策參考或是智能投資。

另外我們在基礎的金融量化分析模型的基礎上,還可以升級為量化分析引擎,作為金融大模型的基礎服務之一,使用ChatGPT或是其他嵌入式的工具,快速為用戶或是機構提供便捷準確的金融服務,進而提升整個社會的金融運行效率以及質量。

人工智能金融量化分析,是一個非常復雜的系統工程,受限于作者水平,不能面面俱到,如果有不足之處,請大家指正!也非常歡迎朋友們隨時交流。感謝大家閱讀!

專欄作家

王佳亮,微信公眾號:佳佳原創。人人都是產品經理專欄作家,年度優秀作者?!懂a品經理知識?!纷髡?。中國計算機學會高級會員(CCF Senior Member)。專注于互聯網產品、金融產品、人工智能產品的設計理念分享。

本文原創發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!