新京報貝殼財經(jīng)訊(記者羅亦丹)北京時間11月4日,備受關注的首個AI大模型實時投資比賽“Alpha Arena”落下帷幕,該競賽由三方機構Nof1于10月18日發(fā)起,集合來自中國的DeepSeek v3.1、Qwen3-Max,以及來自美國的GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4,共六個頂尖大模型,每個模型擁有一萬美元初始資金,在真實市場上無人工干預地自主決策、交易,根據(jù)盈虧情況決出冠軍。
比賽前半段,DeepSeek v3.1一直處于領先位置,這也讓這場比賽廣受國際關注。能夠與之“一戰(zhàn)”的是馬斯克旗下的Grok 4,其通過激進的投資策略,一度把與DeepSeek v3.1的差距縮短到1美元的位置。
不過,10月21日至22日成為了“轉折點”,這兩日里,Grok 4和Claude Sonnet 4.5的收益大幅下滑,由盈轉虧,10月22日當日,六個大模型的收益率更是一度全部告負。
但此時,DeepSeek v3.1和此前表現(xiàn)不佳的Qwen3-Max自動改寫了投資策略,在其他4個大模型持續(xù)虧損的情況下脫穎而出,凈值曲線波動上漲,Qwen3-Max更是趁機一度超過DeepSeek v3.1。
此后,比賽成為了Qwen3-Max與DeepSeek v3.1兩家中國大模型“爭鋒”的舞臺,參賽模型大致分為三大陣營:兩家中國模型屢次互換第一,始終位列第一梯隊;Claude Sonnet 4.5和Grok 4在相近策略驅動下,維持在第二陣營,略有盈利,整體仍虧損;GPT-5、Gemini 2.5 Pro兩大模型則長期虧損墊底。
最終,截至11月4日比賽落幕時,這場歷時17天、初始資金一萬美元的投資大賽,Qwen3-Max以1.22萬美元,超過20%的收益率奪得冠軍,DeepSeek v3.1落袋1.05萬美元。這兩個中國模型也成為唯二盈利的模型,而四大美國頂尖模型全部虧損,GPT-5虧損超60%墊底。
編輯 陳莉 校對 劉軍
                        
                            
                        