Finance

台股量化交易根本不需要AI?一位年賺40%的老手揭露:Excel土砲策略為何完勝你燒百萬訓練的機器學習模型

量子操盤手 (Quantum Trader)May 01, 20265 min read
台股量化交易根本不需要AI?一位年賺40%的老手揭露:Excel土砲策略為何完勝你燒百萬訓練的機器學習模型

別急著燒錢搞深度學習,台股散戶用Excel公式跑均值回歸,績效可能屌打你的神經網路。

去年底我在一個私人交易聚會上,遇到一個五十幾歲的大哥。他沒有GitHub帳號,不知道Python是什麼,甚至覺得Jupyter Notebook是某種筆記本品牌。但他過去三年的年化報酬率穩定在35%到42%之間。

他的工具?Excel。對,就是微軟那個Excel。

我當場以為他在唬爛。結果他打開筆電,秀出一個巨大的試算表——裡面塞滿了台股個股的月營收成長率、本益比河流圖、還有他自己土砲的均值回歸訊號。公式不超過二十個,邏輯簡單到讓人不舒服。當股價偏離二十日均線超過兩個標準差就買,回到均線就賣。沒有什麼LSTM、沒有XGBoost、沒有強化學習。就這樣。

坦白講,這件事讓我非常不爽。因為我自己花了大半年、燒了不少雲端運算費用,用Python加上Backtrader框架,搭配LightGBM做特徵工程,試圖在台股找到alpha。結果呢?回測績效很漂亮,一上實盤就崩。

問題出在哪?

先說回測這件事。很多人(包括以前的我)會掉進一個經典陷阱:過度擬合。你拿五年的歷史資料去訓練模型,調了一百個參數,回測報酬率200%,夏普比率3.5,覺得自己發現了聖杯。但這些數字只是你把模型「硬凹」成跟歷史數據完美契合的結果。換一段時間區間,績效立刻腰斬。

那位Excel大哥的策略為什麼能活?因為它簡單到沒辦法過度擬合。參數就那幾個——均線天數、標準差倍數、停損百分比。你想overfitting都很困難。這就是所謂的「自由度」問題:模型越複雜,自由度越高,越容易在樣本內表現完美、樣本外一塌糊塗。

我後來開始用開源框架重新檢視這件事。先講幾個我實際碰過的工具。

Backtrader是Python生態裡最老牌的回測框架,社群大、文件多,但說實話它的程式碼架構有點過時,跑大量資料的時候效能不太行。Zipline(Quantopian留下的遺產)已經幾乎沒人維護了。比較值得關注的是Lean——QuantConnect背後的開源引擎,支援多資產、多市場,而且架構現代化很多。如果你要玩加密貨幣的話,Hummingbot是做市策略的好選擇,但它本質上是個交易機器人而不是回測框架。

台灣這邊,永豐的Shioaji和富果Fugle API讓散戶終於能用程式下單了。但老實說,光是搞定憑證安裝、行情訂閱、委託回報這些基礎建設,就能消耗你好幾個週末。等你終於把pipeline跑通,可能會發現——你的策略邏輯本身根本不需要這麼複雜的基礎建設。

這就是我想說的核心觀點:大多數散戶量化交易者,把80%的精力花在工具和模型上,只花20%在策略邏輯上。但真正決定你能不能賺錢的,是那20%。

我認為AI和機器學習在量化交易中當然有用——但那是給Renaissance Technologies和Two Sigma這種等級的機構用的。他們有獨家數據源(衛星圖像、信用卡消費數據、社群情緒即時流),有幾百台GPU的運算叢集,有幾十個PhD在調模型。你一個人用公開的OHLCV資料去訓練神經網路,跟他們比什麼?

更何況台股有個很特殊的結構。日成交量三千億上下(好的時候),個股流動性差異極大,加上漲跌幅限制10%、T+2交割、當沖稅率優惠等制度面因素,這些東西很難被塞進一個通用的ML模型裡。反而是簡單的規則型策略——比如月營收公布後的動能效應、除權息前後的統計套利、法人連續買超的跟單邏輯——這些用Excel或Google Sheets就能做的東西,長期下來往往更穩定。

當然我不是說你應該永遠只用Excel(雖然那位大哥確實只用Excel)。我的意思是:在你決定導入任何花俏的技術之前,先問自己一個問題——你的策略邏輯,能不能用一句話說清楚?如果不行,那問題可能不是工具不夠強,而是你根本還沒想清楚自己在賭什麼。

回測的時候也別忘了幾個基本避雷原則。Look-ahead bias(前視偏差)是最常見的:你用了未來才會知道的資訊來做決策,比如用當季EPS去判斷季初的買點——拜託,那時候財報還沒公布。Survivorship bias(生存者偏差)也很致命:你的回測股票池只包含現在還在上市的公司,那些已經下市的地雷股全被排除了,績效當然好看。

最後講個真實感受。那位大哥跟我說了一句話,我到現在還記得:「年輕人,你們太聰明了,聰明到一直在找不存在的東西。」

他的意思是:市場裡確實有可重複的模式。但這些模式通常不複雜,只是很無聊。無聊到你覺得不值得用機器學習去做。可是無聊的東西才能堅持,才能重複,才能長期獲利。

你的神經網路能做到這一點嗎?


🛠️ CULTIVATE Recommended Tools | 精選工具推薦

  • Codecademy: Learn Python and Data Science interactively from scratch.

Disclosure: CULTIVATE may earn a commission if you purchase through these links.

Related Stories