【實測】把PTT當內線?工程師用AI寫出「量化跟單機器人」,3個月績效狠甩00929!網驚:太神了
台灣工程師實測用 Python 爬取 PTT 股版輿情,結合 AI 語意分析打造「鄉民跟單策略」。回測顯示,該策略在 2025 Q4 震盪盤中績效超越熱門高股息 ETF 00929,揭示「反指標」傳說背後的量化真相。
在台灣交易圈,PTT Stock 版(股版)一直有個都市傳說:「鄉民看多你就空,鄉民看空你就多」,將股版視為標準的「反指標」。但到了 2026 年,隨著 NLP(自然語言處理)技術的成熟,一位台灣工程師決定用數據驗證這個傳說,結果卻跌破眾人眼鏡。
這項名為「PTT 輿情量化(PTT Sentiment Quant)」的實測計畫,利用 Python 爬蟲與 LLM(大型語言模型),針對 PTT 股版進行 24 小時監控。在 2025 年第四季的實盤模擬中,該策略取得了 15.6% 的報酬率,遠超同期僅約 2% 的人氣高股息 ETF 00929。
核心技術拆解:如何聽懂「鄉民話」?
這套系統並非簡單的關鍵字統計,其核心架構分為三層:
-
數據採集 (The Ear): 使用 Python 的
requests與BeautifulSoup庫,針對 PTT Stock 版進行即時爬取。重點不只是內文,還有「推噓文」的比例與速度。爆文(推文數 > 100)通常意味著極高的市場關注度。 -
語意理解 (The Brain): 這是最關鍵的一步。傳統的情緒分析模型(如 SnowNLP)看不懂台灣鄉民的「黑話」。該工程師串接了 Gemini 或 OpenAI API,並針對 PTT 特用語進行了 Prompt Engineering(提示工程)。
- 識別反諷:「這支股票穩了(下看50塊)」機器人能識別這是「看空」而非「看多」。
- 關鍵詞權重:對「法會」(法說會變利空)、「睡公園」(賠光)、「歐印」(All-in)等詞彙賦予極高的情緒權重。
- 交易決策 (The Action): 將非結構化的文字轉為量化指標(Sentiment Score, -1 到 +1)。
- 策略邏輯:當某檔標的 1 小時內討論熱度飆升且情緒分數 > 0.8(極度樂觀)時,視為短線動能進場訊號;若情緒分數驟降或出現「畢業文」潮,則觸發止損。
實戰績效與盲點
回測數據顯示,這套策略在捕捉「中小型飆股」時極為精準,因為這類股票受散戶情緒影響大。然而,針對台積電 ($TSM) 或聯發科這類外資主導的大型權值股,PTT 的情緒指標則顯著失效,甚至出現「反指標」現象——鄉民極度看好時,往往是短線高點。
給開發者的避雷指南:
- Look-ahead Bias(偷看未來):在回測時,千萬不能用「收盤後的總推文數」來決定「開盤時的買賣」,必須嚴格依據時間戳記(Timestamp)。
- 流動性陷阱:鄉民熱議的往往是成交量小的妖股,回測雖然大賺,但實單可能根本買不到或是滑價(Slippage)極大。
這項實驗證明,AI 時代的交易優勢,不在於獲取資訊的速度,而在於「解讀資訊的深度」。當所有人都在看線圖時,讀懂人心的演算法,或許才是 2026 年最強的 Alpha。