share_log

網友提問「中國大模型何時達到Fable級別?」,馬斯克「可能明年Q1」,智譜CEO唐傑「不需要那麼久」

華爾街見聞 ·  06/19 10:14

智譜AI發佈GLM-5.2後,研究員Teortaxes判斷中國模型追趕上Fable級別模型需7個月。GLM-5.2在FrontierSWE基準上得74.4分,僅落後Opus 4.8約1個百分點。國產開源模型憑藉性能、成本與自主可控優勢,正重塑全球AI競爭格局。

圍繞Anthropic前沿模型遭出口管制下架,一場關於中國大模型追趕時間表的公開辯論正在X平台上演,多方觀點的交鋒折射出AI行業格局加速重塑的現實。

$智譜 (02513.HK)$AI發佈GLM-5.2後,6月18日,一名X用戶向獨立研究員、AI 開發博主Teortaxes提問"中國大模型何時達到Fable級別"。

Teortaxes給出了7個月的時間差判斷,馬斯克隨即回覆"可能(2027年)第一季度",智譜AI CEO唐傑則直接表態"不需要那麼久"。

馬斯克隨後補充,在基準測試上追趕相對容易,但以"真實實用性"衡量,明年Q1也已經相當出色。

這場對話的背景是GLM-5.2在關鍵編程基準FrontierSWE上取得74.4分,僅落後Anthropic頂級閉源模型Opus 4.8約1個百分點,並超過GPT-5.5。

華爾街見聞此前提及,美國商務部對Anthropic旗下Fable 5和Mythos 5實施出口管制,要求向任何外國人提供訪問權限前須取得政府許可證,Anthropic隨即關閉兩款模型的全球訪問權限。

技術追趕與AI成本兩股力量同步作用,正在重塑全球AI競爭格局。正如zerohedge所指出的,當"10%的智能差距"可能對應"90%的成本優勢"時,逾5萬億美元的資本配置是否存在錯配,將成爲市場持續追問的核心命題。

時間表之爭:從7個月到"不需要那麼久"

爭論的起點來自Teortaxes對GLM-5.2性能位置的判斷。

他認爲,GLM-5.2整體能力處於Opus 4.7至4.8區間,他表示Opus的視覺能力本身較弱,綜合考慮視覺能力後中國大模型差距大致爲7個月。

他的推算邏輯是,Mythos模型於2026年2月初達到Preview狀態(即≥Opus 4.8的功能水平),以此類推,中國模型達到完整"Fable"級別的時間窗口約在2026年11月至12月。

馬斯克的判斷則更爲保守,僅以"Probably Q1"回應,對應2027年一季度。

但他隨後補充了一個重要分層:在基準測試層面,追趕進展或許確實令人印象深刻;而以"真實實用性"衡量,即便到Q1也已相當不易。

他點名Anthropic的優勢正在於專注於提升真實智能,這種能力不顯現在基準分數上,但直接反映在營收上。

對於馬斯克的言論,有AI業內人士認爲,馬斯克的預測相對保守,中美模型水平的時間差可能短於7個月。

$谷歌-C (GOOG.US)$DeepMind首席執行官德米斯·哈薩比斯此前也表示,中國的人工智能模型在能力上可能「只差幾個月」就能趕上海外。

唐傑的回覆則更爲簡短直接:"won't take that long"——不需要那麼久。這一表態隱含了智譜對自身迭代速度的信心,但並未給出具體時間節點。

AI研究機構Proximal評價稱,GLM-5.2是"第一個真正縮小了Anthropic/OpenAI與其他模型提供商之間巨大技術鴻溝的模型"。

GLM-5.2的技術座標:逼近閉源前沿,差距仍存

圍繞這場時間表討論,GLM-5.2的技術指標是核心依據。

6月15日,智譜宣佈正式上線並開源新一代旗艦大模型GLM-5.2。在全球百萬用戶參與盲測的前端開發評估系統Code Arena上,該模型位列全球可用模型第一位。

與以往主打即時問答能力的模型不同,GLM-5.2主攻「長程任務」——讓AI不再只做即時問答,而能像人一樣連續工作數小時、自主跑完一個完整的大型工程。

根據發佈數據,GLM-5.2參數規模爲753B,配備1M token穩定上下文窗口,採用MIT協議完全開源。

在長程編程基準FrontierSWE上,GLM-5.2得分74.4,Opus 4.8爲75.1,差距約1個百分點,同時超過GPT-5.5的72.6以及Opus 4.7。

在PostTrainBench(測試Agent訓練小模型能力)上,GLM-5.2以34.3分排名第二,僅次於Opus 4.8的37.2,高於GPT-5.5的28.4。

差距仍然存在。在最高難度的SWE-Marathon基準上,GLM-5.2得分13.0,而Opus 4.8爲26.0,落差明顯。

三個基準加在一起,傳遞的信息是:在中等複雜度的長程任務上,GLM-5.2 已經進入了與頂級閉源模型同台競爭的區間;在最極端複雜度的任務上,它仍然落後,但在開源陣營裏獨領先位。

Anthropic模型下架,開源替代邏輯加速成立

驅動這場討論的另一重要背景,是Anthropic旗下Fable 5和Mythos 5的突然下線。

華爾街見聞提及,Anthropic事件暴露出閉源商業模型在可獲得性上的脆弱性,併爲開源陣營帶來了超越技術層面的戰略價值。

在GLM-5.2發佈的同時,智譜AI CEO唐傑在X平台發表聲明:

在前沿模型被無故切斷訪問的時刻,我們更加確信一件事:科學應當是全球的。通往AGI的道路絕不能由高牆圍困。

這一時機選擇將開源從技術路線提升至技術主權的敘事層面。該條推文在24小時內獲得超過88萬次瀏覽和252條回覆。

東方證券認爲,開源模型具備開放權重、自主可控、可本地部署等特徵,使其成爲規避地緣政治風險、保障業務連續性的更優選擇。

由於國內模型性能領先、多數開源、API調用成本較低,中國模型已在OpenRouter等Token分發平台上佔據領先位置。疊加Anthropic兩款模型下架,國產模型API調用量有望進一步提升。

但從中長期邏輯看,成本下降與訪問門檻降低,可能推動詞元消耗量和算力需求同步擴張。對投資者而言,開源模型份額提升與算力需求高增,正在成爲AI產業鏈重估的核心變量。

編輯/melody

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與象象銀行相關的任何投資建議。象象銀行竭力但無法保證上述全部內容的真實性、準確性和原創性。