一時(shí)的技術(shù)成果或者用戶增長(zhǎng),很難成為 AI 公司的競(jìng)爭(zhēng)優(yōu)勢(shì)。
大會(huì)結(jié)束,月之暗面創(chuàng)始人楊植麟被觀眾層層圍住,有人舉著手機(jī)想加他微信,有人追到茶歇區(qū)要簽名。投資這家公司的機(jī)構(gòu),拉一整大巴的投資人去拜訪他,“讓一線投資人見(jiàn)見(jiàn)好的創(chuàng)業(yè)者是什么樣子”。
MiniMax 創(chuàng)始人閆俊杰很少公開(kāi)露面,網(wǎng)上能搜到的照片沒(méi)幾張。這無(wú)礙他在投資行業(yè)的熱度。MiniMax 估值長(zhǎng)期排在中國(guó)大模型創(chuàng)業(yè)公司前列,投資人要靠 “搶” 才能拿到份額。
這一切發(fā)生在 DeepSeek 爆火前。今年初,兩家明星創(chuàng)業(yè)公司一起被擠到聚光燈邊緣。
春節(jié)后的第一個(gè)工作周,兩家公司的二號(hào)位各自召開(kāi)了內(nèi)部會(huì)議,討論 DeepSeek 之后該怎么做增長(zhǎng)。月之暗面在長(zhǎng)達(dá) 6 個(gè)小時(shí)的會(huì)議后,決定暫緩?fù)斗牛貧w產(chǎn)品和技術(shù)本身。在 MiniMax,DAU 被稱為 “虛榮指標(biāo)”。
兩家公司有員工覺(jué)得,這是一種 “解脫”:不用再絕望地消耗資源與字節(jié)等巨頭競(jìng)爭(zhēng),也無(wú)需拼命證明 “中國(guó)能誕生 OpenAI”。問(wèn)題已經(jīng)失去意義。
在這之后,兩家公司取得更好的技術(shù)進(jìn)展。MiniMax 的視頻生成模型,宣稱在一些場(chǎng)景超過(guò) Google 的 Veo3;其開(kāi)源的 M2 文本模型,在部分測(cè)評(píng)中位列全球開(kāi)源模型第一。月之暗面的 K2 模型,被稱為 “中國(guó)又一個(gè) DeepSeek”;近期發(fā)布的 K2 Thinking,宣稱部分基準(zhǔn)測(cè)試得分超過(guò) GPT-5。
他們的壓力并沒(méi)有消失。MiniMax 和月之暗面曾用較少的資源證明過(guò)增長(zhǎng)潛力。兩家公司因此拿到中國(guó)大模型創(chuàng)投領(lǐng)域大多數(shù)資金,總計(jì)超過(guò) 200 億元人民幣。
這筆錢(qián)很少,讓他們難與字節(jié)、阿里,甚至是 DeepSeek 正面競(jìng)爭(zhēng),或者是對(duì)標(biāo) OpenAI、Anthropic 這些海外同行。但這筆錢(qián)又足夠多,讓他們無(wú)法收斂野心。
閆俊杰和楊植麟是中國(guó)大模型領(lǐng)域的 “雙子星”。他們幾乎在同一時(shí)間走進(jìn)公眾視野,講著相似的理想——相信技術(shù),追求 AGI;也都在融資、流量、爭(zhēng)議與期待中長(zhǎng)期被同一個(gè)問(wèn)題拷問(wèn):中國(guó)的 OpenAI,會(huì)誕生在哪?
兩人的相同之處并不多。閆俊杰崇尚 “系統(tǒng)理性”,想要在龐雜的約束中尋找最優(yōu)解。他把公司視作可以設(shè)計(jì)和優(yōu)化的函數(shù),堅(jiān)信組織的力量能夠催生創(chuàng)新與增長(zhǎng)。
他敢于決斷,然后接受沖突,迅速迭代。他創(chuàng)辦的 MiniMax,在技術(shù)路線上選擇多模態(tài)模型,是中國(guó)最早推出 MoE 模型的團(tuán)隊(duì)之一。
楊植麟則相信人才的力量,公司的核心產(chǎn)品 “Kimi” 也是他的英文名,個(gè)人光環(huán)與公司品牌深度綁定。
他看重 “共識(shí)驅(qū)動(dòng)”,相信少數(shù)精英能引領(lǐng)方向。與 MiniMax 不同,他創(chuàng)辦的月之暗面更執(zhí)著于無(wú)損的語(yǔ)言模型本身的力量,一度不怎么在意 MoE。
現(xiàn)在他們要解決的問(wèn)題是一樣的。之前三年過(guò)山車(chē)般的經(jīng)歷表明,一時(shí)的技術(shù)成果或者用戶增長(zhǎng),很難成為競(jìng)爭(zhēng)優(yōu)勢(shì)。他們還要建立讓技術(shù)和用戶增長(zhǎng)持續(xù)產(chǎn)生的組織能力。
技術(shù) CEO、管家二號(hào)位
2017 年,在商湯擔(dān)任 CEO 助理的贠燁祎,就向云啟資本合伙人、也是她在約翰霍普金斯的師兄陳昱提出過(guò)創(chuàng)業(yè)設(shè)想,但因?yàn)槿焙匣锶藳](méi)能推進(jìn)。四年后,她再次找到陳昱:“我終于找到創(chuàng)業(yè)搭子了。”
這個(gè)搭子,就是閆俊杰。
閆俊杰是典型的 “系統(tǒng)內(nèi)優(yōu)勝者”。他出生于 1989 年,在河南的縣城長(zhǎng)大,博士就讀于中國(guó)科學(xué)院自動(dòng)化所。
2014 年博士畢業(yè)后,閆俊杰加入商湯,在這家核心成員大多來(lái)自香港中文大學(xué)和海外高校博士生的公司中,他只用了五年時(shí)間,就從算法工程師一路做到最年輕的副總裁、研究院副院長(zhǎng),負(fù)責(zé)智慧城市、游戲等多個(gè)業(yè)務(wù)。他參與了商湯底層算法到工程落地的體系建設(shè),發(fā)表上百篇論文。

MiniMax 創(chuàng)始人閆俊杰。圖片來(lái)自視覺(jué)中國(guó)。
閆俊杰第一次見(jiàn)陳昱,就給對(duì)方留下深刻印象:一是光頭,“一看就是絕頂聰明”;二是閆俊杰跟他講,可以用基礎(chǔ)模型,解決更加通用和泛化的問(wèn)題。
“現(xiàn)在看來(lái)當(dāng)然是常識(shí),但在行業(yè)都還在講用若干小模型解決復(fù)雜問(wèn)題的 2021 年,令人耳目一新。” 陳昱說(shuō)。
2021 年底,閆俊杰離職創(chuàng)辦 MiniMax。閆俊杰負(fù)責(zé)技術(shù),贠燁祎負(fù)責(zé)技術(shù)之外的產(chǎn)品、融資等事務(wù)。一位 MiniMax 早期人士說(shuō):“閆俊杰想要做全世界最偉大的技術(shù),贠燁祎想做全世界最偉大的公司。”
閆俊杰把 AGI 視為 “普通人每天都會(huì)用的一個(gè)產(chǎn)品、一個(gè)服務(wù)”。一位 MiniMax 前員工說(shuō),他加入 MiniMax,是被會(huì)議室墻上的一行字打動(dòng)——Intelligence for Everyone。
MiniMax 的第一輪融資印證了這套故事的吸引力:閆俊杰在與高瓴創(chuàng)始人張磊聊過(guò)后,高瓴直接取代云啟,拿下首輪 2000 萬(wàn)美元融資的領(lǐng)投。MiniMax 投后估值達(dá)到 2 億美元。
月之暗面起步?jīng)]那么順利。2023 年初,剛成立的月之暗面想融資 2000 萬(wàn)美元還不順利。在投資人眼里,楊植麟只有 “技術(shù)” 標(biāo)簽,缺少產(chǎn)品、管理、融資經(jīng)驗(yàn)。
出生于 1992 年的楊植麟是廣東汕頭人,頭發(fā)茂密,他在卡耐基梅隆讀博期間,發(fā)布的大語(yǔ)言模型相關(guān)論文 XLNet 和 Transformer-XL,現(xiàn)在引用接近兩萬(wàn)。

月之暗面創(chuàng)始人楊植麟。圖片來(lái)自視覺(jué)中國(guó)。
同樣在讀博士期間,27 歲的楊植麟?yún)⑴c創(chuàng)辦 AI 公司循環(huán)智能。他在自己的個(gè)人主頁(yè)上寫(xiě)道:“我所有工作的目標(biāo),包括研究和商業(yè),都是最大化人工智能的價(jià)值。”
月之暗面的起點(diǎn),是楊植麟在循環(huán)智能負(fù)責(zé)的團(tuán)隊(duì)。2021 年,楊植麟主導(dǎo)了華為云合作的千億級(jí)盤(pán)古大模型,團(tuán)隊(duì)就叫 “Moonshot”。兩年后,他推動(dòng) “Moonshot” 從循環(huán)獨(dú)立,成立月之暗面。他認(rèn)為要 “專門(mén)建一家公司,而不是從別的業(yè)務(wù)里拐出一條支線。”
起步融資遇挫,楊植麟想到循環(huán)智能的投資人、也是他的清華學(xué)姐張予彤。在 2019 年,還在金沙江創(chuàng)投的張予彤就主導(dǎo)投資了循環(huán)智能。
在張予彤的推動(dòng)下,月之暗面最終在 2023 年上半年完成第一筆融資,紅杉、真格、Monolith 的下注讓楊植麟趕上了窗口期。張予彤如今在月之暗面的角色是二號(hào)位,與贠燁祎在 MiniMax 類似,負(fù)責(zé)融資、增長(zhǎng)等業(yè)務(wù)。不過(guò)張予彤的加入,后來(lái)也讓月之暗面陷入潛在的利益沖突與仲裁風(fēng)波。
雖然起步方式不同,兩位創(chuàng)始人在公司的發(fā)展上做出了類似的選擇:用大半年時(shí)間研發(fā)基礎(chǔ)模型后,嘗試做 C 端產(chǎn)品,并迎來(lái)了第一個(gè)爆發(fā)點(diǎn)。
2022 年中,MiniMax 投入數(shù)名員工,用一個(gè)月的時(shí)間做出了 AI 對(duì)話產(chǎn)品 Glow,用戶可以在這個(gè)產(chǎn)品上自由創(chuàng)建角色,并和角色對(duì)話。他們本想用游戲化的方式收集數(shù)據(jù),“沒(méi)人想到這個(gè)產(chǎn)品會(huì)一炮而紅”。Glow 上線 4 個(gè)月后注冊(cè)用戶超過(guò)五百萬(wàn)。
“Glow 出乎意料的成功讓公司的重心轉(zhuǎn)向了 C 端產(chǎn)品。” 一位 MiniMax 員工說(shuō)。2023 年底,MiniMax 有約 300 名員工,其中近 200 人在產(chǎn)品線,遠(yuǎn)超同類大模型創(chuàng)業(yè)公司。
月之暗面的故事類似。2023 年 8 月,他們第一個(gè)模型訓(xùn)練到后期,開(kāi)始立項(xiàng)做 AI 助理 Kimi,當(dāng)時(shí)整個(gè)公司只有 50 人,預(yù)期只是 “展示模型能力”。上線之后,Kimi 連續(xù)數(shù)月月活用戶環(huán)比增長(zhǎng)超過(guò) 100%。
“用了最少的錢(qián),最少的人,最少的卡,做到了最好的狀態(tài)。” Monolith 創(chuàng)始合伙人曹曦曾如此評(píng)價(jià)月之暗面,他的基金跟進(jìn)了月之暗面三輪融資。
到 2023 底再融資時(shí),月之暗面成為資本追捧的對(duì)象。小紅書(shū)投前 9 億美元估值的價(jià)格很快被阿里壓過(guò):投資近 8 億美元,將月之暗面的估值抬升到 23.4 億美元。
這讓它的估值與 2021 年就成立的 MiniMax 并駕齊驅(qū),膨脹速度遠(yuǎn)超上一代 AI 公司。同一時(shí)間,MiniMax 也拿到阿里投資的 6 億美元資源,估值又超過(guò)月之暗面。
兩筆融資 2024 年初完成,合計(jì)超 14 億美元(100 億元人民幣),超過(guò)中國(guó)大模型創(chuàng)投領(lǐng)域上一年公開(kāi)融資總額,改寫(xiě)了行業(yè)格局。
早期增長(zhǎng)吸引大額投資,也成了競(jìng)爭(zhēng)中的弱點(diǎn)
大額資本的注入放大了兩位創(chuàng)始人的野心。2024 年初,閆俊杰定下激進(jìn)目標(biāo):技術(shù)達(dá)到 GPT-4 的水平,把產(chǎn)品用戶規(guī)模翻十倍,單個(gè)產(chǎn)品能突破千萬(wàn) DAU。
這一年的 MiniMax 很像字節(jié)跳動(dòng):同時(shí)推進(jìn)多條產(chǎn)品線,從 Talkie、星野到海螺 AI,還有幾個(gè)沒(méi)有上線過(guò)就放棄的產(chǎn)品。年中,MiniMax 員工總數(shù)增長(zhǎng)到 400 左右。
公司成立剛一年,楊植麟定下覆蓋多個(gè)方向的目標(biāo):技術(shù)上深入無(wú)損長(zhǎng)文本、視頻生成、多階段推理;產(chǎn)品上追求 DAU 增長(zhǎng)、出海;并加大商業(yè)化力度。到年中,信奉精英策略的月之暗面,員工也翻了一番。
問(wèn)題跟著爆發(fā)。MiniMax 陷入糾結(jié)與搖擺,這年 1 月,MiniMax 視覺(jué)模型團(tuán)隊(duì)開(kāi)始押注視頻模型;3 月,他們抽調(diào)星野 /Talkie 和開(kāi)放平臺(tái)的一部分研發(fā)人員,做產(chǎn)品形態(tài)類似即夢(mèng)的視頻生成項(xiàng)目;5 月,他們放棄這個(gè)產(chǎn)品形態(tài)項(xiàng)目。
到了 8 月,高層要求在一周內(nèi)讓模型 “能用”,要趕上公司的 Open Day。一位員工回憶,那時(shí)模型生成的人物 “手腳還在亂飛”,而承載視頻模型的產(chǎn)品項(xiàng)目早已放棄。
最終團(tuán)隊(duì)先做了網(wǎng)頁(yè)版上線,讓用戶測(cè)試,移動(dòng)端往后延,嫁接到原本主打語(yǔ)音交互的海螺 AI 上。不過(guò)就像 Glow 一樣,他們對(duì)這個(gè)產(chǎn)品期望不高。但第二個(gè)月,其網(wǎng)頁(yè)端訪問(wèn)量就接近 500 萬(wàn)。
一位 MiniMax 員工回憶,2024 年的大部分時(shí)間,他們都被這種 “既要又要” 的氣氛影響——公司既想增長(zhǎng),又不想將模型往 “軟色情” 方向調(diào)整,但 “一健康就不增長(zhǎng)”。高層一度要求暫停在 Talkie、星野等產(chǎn)品上增加廣告位,但收入下滑后又陷入焦慮。
閆俊杰說(shuō),他經(jīng)歷過(guò)技術(shù)被資本裹挾的過(guò)程:“如果一家企業(yè)必須靠不斷融資才能前進(jìn),那它優(yōu)化的就不再是產(chǎn)品,而是如何說(shuō)服投資人繼續(xù)給錢(qián)。”
月之暗面的精英策略也沒(méi)有在新方向上發(fā)揮太多效果。他們想要復(fù)現(xiàn) Sora 的視頻模型,但效果一直未及預(yù)期,唯一的 “亮相”,是幾位聯(lián)合創(chuàng)始人在朋友圈里發(fā)布的幾條視頻,稱由自家視頻模型生成;月之暗面低調(diào)上線的兩款出海產(chǎn)品 Ohai 和 Noisee,幾個(gè)月后便停止運(yùn)營(yíng)。
在這期間,月之暗面創(chuàng)始團(tuán)隊(duì)出售股份,迅速在創(chuàng)投領(lǐng)域引發(fā)風(fēng)波。關(guān)鍵不在于賣(mài)股份,而在于月之暗面背后的敘事失調(diào)。產(chǎn)品未定型、格局未穩(wěn)固的時(shí)刻,創(chuàng)始團(tuán)隊(duì)出售股份,很容易被理解為 “急于落袋為安”。
風(fēng)波之中,我們?cè)鴨?wèn)他此事,他以一句 “Fake news” 簡(jiǎn)短作答。
2024 年中,“大模型進(jìn)展放緩” 的論調(diào)開(kāi)始流行。當(dāng)技術(shù)可能很難帶來(lái)巨大突破時(shí),市場(chǎng)和投資人衡量公司增長(zhǎng)潛力的指標(biāo),轉(zhuǎn)向最直接的 DAU 數(shù)據(jù)。
在月之暗面,張予彤主導(dǎo)大規(guī)模投流,拉高了 B 站等平臺(tái)的 AI 產(chǎn)品投流價(jià)格。MiniMax 也在高層反復(fù)的糾結(jié)后,最終決定跟進(jìn)。
他們?cè)僖淮伪毁Y本看好。MiniMax 拿到騰訊等機(jī)構(gòu)的投資;8 月,月之暗面獲得騰訊、高榕創(chuàng)投等 3 億美元融資。資本意志開(kāi)始更深地介入公司經(jīng)營(yíng),部分投資人頻繁給他們提供增長(zhǎng) “建議”:哪些海外 AI 應(yīng)用公司增長(zhǎng)更快,哪些投流策略更高效,哪類產(chǎn)品功能更能帶來(lái)留存。
可一同出現(xiàn)的還有更強(qiáng)的對(duì)手。字節(jié)跳動(dòng)發(fā)動(dòng)了飽和式進(jìn)攻:產(chǎn)品線覆蓋一切,從生產(chǎn)力到娛樂(lè),從助手到硬件。我們了解到,字節(jié)還嚴(yán)格控制外部 AI 產(chǎn)品在抖音上的投放,而豆包等作為字節(jié)系產(chǎn)品,還能享受折扣。
一位月之暗面員工回憶,那是公司的士氣低谷,“面對(duì)字節(jié)這樣的敵人,是打不過(guò)的。” 一位投資人稱,如果不推動(dòng)公司轉(zhuǎn)型,“除了硬著頭皮跟字節(jié)拼消耗,似乎別無(wú)他法”。
到這一年 10 月,一場(chǎng)數(shù)位投了大模型的投資人參加的聚會(huì)中,他們開(kāi)始討論 “如何能賣(mài)掉部分手里的大模型創(chuàng)業(yè)公司股份?”
追求技術(shù)可以是一種選擇,但空間越來(lái)越小
DeepSeek “解救” 了 MiniMax 和月之暗面。他們靠著遠(yuǎn)超市場(chǎng)預(yù)期的模型,沒(méi)花一分錢(qián)投流,就在一周內(nèi)吸引了數(shù)千萬(wàn)用戶,制造了中國(guó)自己的 ChatGPT 時(shí)刻。
“如果你在對(duì)手更強(qiáng)的賽道,那你就沒(méi)有勝的可能。” 一位月之暗面員工說(shuō),DeepSeek 帶來(lái)的熱潮,讓他明顯感覺(jué)到公司內(nèi)部情緒有了好轉(zhuǎn),“只要技術(shù)夠強(qiáng),就有機(jī)會(huì)逆天改命。”
月之暗面不再更新 K1 系列的模型,集中資源投入基礎(chǔ)算法與新模型 K2。這個(gè)新模型被寄予厚望,月之暗面研發(fā)團(tuán)隊(duì)幾乎全員參與,楊植麟本人也親自下場(chǎng)寫(xiě)代碼。
張予彤在社交平臺(tái)上寫(xiě)道,“小伙伴為了這次發(fā)布直接睡在公司里”,配圖是一個(gè)帶有 “離發(fā)布還有 0 天” 標(biāo)語(yǔ)的圖片,標(biāo)語(yǔ)下是一張沙發(fā)床。
幾個(gè)月高強(qiáng)度開(kāi)發(fā)后,月之暗面在 7 月發(fā)布并開(kāi)源萬(wàn)億參數(shù)的 MoE 模型 Kimi K2,宣稱在自主編程、工具調(diào)用和數(shù)學(xué)推理等維度上超過(guò) DeepSeek-V3 和阿里 Qwen3。在這之前,楊植麟相信 “閉源是正確的路”?!蹲匀弧冯s志網(wǎng)站的一篇文章稱其為 “中國(guó)的又一個(gè) DeepSeek 時(shí)刻”。
MiniMax 也完成了類似的聚焦。他們將重點(diǎn)從 “模型與產(chǎn)品并重” 收縮到 “模型優(yōu)先”。視頻、語(yǔ)音等多模態(tài)模型依然在研究,這是他們有優(yōu)勢(shì)的方向。我們了解到,閆俊杰還把一部分產(chǎn)品的員工轉(zhuǎn)到模型團(tuán)隊(duì),并為文本模型重新分配算力,核心資源集中到語(yǔ)言模型的基礎(chǔ)能力上,增加數(shù)學(xué)與編程數(shù)據(jù)的比重。他之前說(shuō),MiniMax 沒(méi)必要為了一篇新聞稿,就訓(xùn)練一個(gè)類似 o1 那樣的推理模型。
他們 10 月開(kāi)源語(yǔ)言模型 M2 時(shí),強(qiáng)調(diào)它的編程和推理能力突出,使用量在 OpenRouter 上已經(jīng)增長(zhǎng)到了前五。“應(yīng)該創(chuàng)業(yè)第一天就開(kāi)源。” 閆俊杰年初說(shuō)。
兩家公司似乎回到了剛創(chuàng)業(yè)時(shí)的狀態(tài),都把提升模型的能力當(dāng)作主線,投資方也不再過(guò)多給公司提建議。公司的經(jīng)營(yíng)依賴創(chuàng)業(yè)者本身管理能力。
閆俊杰看上去溫和,但一旦做出決定,執(zhí)行起來(lái)極為堅(jiān)決。在 MiniMax 創(chuàng)業(yè)初期,團(tuán)隊(duì)曾嘗試過(guò) 3D 數(shù)字人方向。項(xiàng)目尚未上線,閆俊杰判斷這條路與公司長(zhǎng)期技術(shù)路線不符,就立即叫停。項(xiàng)目解散,剛組建的團(tuán)隊(duì)經(jīng)歷第一輪震蕩。
2024 年起,MiniMax 的中層開(kāi)始密集流動(dòng):產(chǎn)品負(fù)責(zé)人、商務(wù)負(fù)責(zé)人、數(shù)據(jù)科學(xué)負(fù)責(zé)人、增長(zhǎng)負(fù)責(zé)人、戰(zhàn)投負(fù)責(zé)人等陸續(xù)離開(kāi)。比如 MiniMax 對(duì)齊團(tuán)隊(duì)兩年內(nèi)換了三任負(fù)責(zé)人——第一任因與閆俊杰激烈爭(zhēng)論技術(shù)進(jìn)展,被降為普通工程師;第二任由下屬提拔,半年后離職。MiniMax 早期的一百名員工,如今已走了一半。
“不是同路人的這些同事,我會(huì)請(qǐng)他們離開(kāi)。我已經(jīng)請(qǐng)走了幾位。” 閆俊杰曾在公司全員會(huì)上說(shuō)。
在他看來(lái),好的成果不是某個(gè)人靈光一現(xiàn)的產(chǎn)物,而是科學(xué)方法和團(tuán)隊(duì)配合下的必然發(fā)現(xiàn),哪怕個(gè)人能力不算頂尖,只要能讓團(tuán)隊(duì)跑得更快,就是合適的人才。
閆俊杰認(rèn)為,管理公司就是優(yōu)化函數(shù),目標(biāo)是商業(yè)化效率、調(diào)用量等變量,管理的核心任務(wù)就是找到 “梯度下降最快的方向”,不斷逼近最優(yōu)解。
MiniMax 的很多決策,比如不做 3D、選擇 MoE 架構(gòu)、做視頻模型,都屬于 “算出來(lái)的結(jié)果”。甚至 MiniMax 每?jī)芍芤淮蔚娜珕T分享會(huì),也叫 “CD”(Coordinate Decent 算法)。
楊植麟相信那些能提出新想法的人才,“因?yàn)樵谶@個(gè)領(lǐng)域,創(chuàng)新本身最有價(jià)值”。他愿意為了招攬一名自己欣賞的技術(shù)人才,從北京飛到深圳,聊上十個(gè)小時(shí),第二天趕早班機(jī)返回;也會(huì)讓優(yōu)秀的研究者自己一個(gè)人在異地自由工作。
他傾向于先達(dá)成共識(shí),再迅速行動(dòng)。月之暗面的第一款模型亮相時(shí),主打 20 萬(wàn)長(zhǎng)文本上下文。但一開(kāi)始,核心團(tuán)隊(duì)有人并不看好這個(gè)方向。一位月之暗面早期員工回憶,2023 年 5 月公司就有人提過(guò)做長(zhǎng)文本,卻被其他人否決,理由是算法視角里,這只是壓縮問(wèn)題,是工程活,不是技術(shù)突破。這個(gè)方向就沒(méi)有推進(jìn)。
兩個(gè)月后,Anthropic 發(fā)布處理 50 萬(wàn)文本的 Claude 模型,引發(fā)行業(yè)震動(dòng)。長(zhǎng)文本成為月之暗面內(nèi)部共識(shí)。“Lossless long context is everything” 成了楊植麟經(jīng)常提的一句話。
但如今 AI 公司把追求模型能力當(dāng)做公司經(jīng)營(yíng)的核心變得愈發(fā)困難。早期的 OpenAI 是一個(gè)參考答案。他們的團(tuán)隊(duì)延續(xù)了 “學(xué)術(shù)式” 的工作節(jié)奏,用實(shí)驗(yàn)和試錯(cuò)推動(dòng)技術(shù)研究,領(lǐng)先技術(shù)成果誕生后加上山姆·阿爾特曼(Sam Altman)從 YC 帶來(lái)的增長(zhǎng)策略,推動(dòng)公司持續(xù)發(fā)展。DeepSeek 的 “學(xué)術(shù)循環(huán)” 模式——批判性思考、原子化創(chuàng)新、推動(dòng)科學(xué)邊界——也是一種策略,但它不用太過(guò)于關(guān)注商業(yè)化和用戶增長(zhǎng)。
MiniMax 和月之暗面很難找到這樣的空間和資源。這場(chǎng)資本密集游戲里,資金、算力和生態(tài)支持至關(guān)重要。OpenAI 的估值已達(dá)到 5000 億美元,要頂著萬(wàn)億美元估值上市;xAI 和 Anthropic 的估值也都逼近 2000 億美元。而 MiniMax 和月之暗面的估值都在 40 億美元左右。這讓誰(shuí)能成為中國(guó) OpenAI 的問(wèn)題變得沒(méi)有意義。
體量較大的美元基金退潮后,中國(guó)擁有大規(guī)模資金的巨頭不愿為創(chuàng)業(yè)公司持續(xù)輸血,反而成為 AI 公司的競(jìng)爭(zhēng)對(duì)手。阿里、字節(jié)、騰訊,甚至是 DeepSeek,研發(fā)基礎(chǔ)模型都有主營(yíng)業(yè)務(wù)(電商、廣告、量化)供血,短期沒(méi)有盈利壓力。
MiniMax 和月之暗面都在嘗試用更專業(yè)的功能(月之暗面的 OK Computer、深度研究;MiniMax 的專業(yè)模式)吸引用戶付費(fèi)訂閱。但只要字節(jié)等公司的同類產(chǎn)品免費(fèi),去年下半年的競(jìng)爭(zhēng)問(wèn)題必然會(huì)再次出現(xiàn)。
他們還在繼續(xù)找錢(qián)。市場(chǎng)消息稱,MiniMax 正籌備赴港上市。月之暗面又開(kāi)了一輪新融資。
大模型注定是需要幾百億美元,甚至上千億美元投入的游戲。創(chuàng)業(yè)公司想要走完這條路,創(chuàng)始人們必須證明,這是一場(chǎng)需要他們參與的長(zhǎng)期探索,才能獲得更多的理解和支持。
這是一道更難的證明題:在巨頭林立、算力稀缺、資本收縮的市場(chǎng)中,是否還有空間容納一種既做基礎(chǔ)研究、又不屬于任何巨頭的 AI 公司?
這不僅需要更多技術(shù)突破,也需要一種在當(dāng)前中國(guó)環(huán)境下罕見(jiàn)的能力——靠投資機(jī)構(gòu)和業(yè)務(wù)收入,維持一支高密度的研究團(tuán)隊(duì)持續(xù)產(chǎn)出。