【杜蘭說AI】中國開源模型 AI平權的希望

1,537 次觀看

太快了，
又一個國產開源大模型殺出來了，
在各大主流榜單全面超越DeepSeek V3和o1-mini，
著名的AI教母李飛飛，
甚至基於這一基礎模型，
50美元成本就做了一個DeepSeek。
它就是國產開源模型的老大哥，
阿里通義千問。
在今年春節前夕，
最新版本Qwen 2.5-Max發布，
又給全球AI圈狠狠加了一把火。

首先給大家辟個謠，
我開頭說的李飛飛團隊的研究，
號稱26分鐘，50美元就訓練出了媲美DeepSeek R1的模型，
這個看著低得嚇人的成本，
應該只是外界預估的雲計算費用。
我去翻了下論文，
里面開篇就表明，
他們是在通義千問模型的基礎上監督微調得來的，
並不是從零造模型。
所以說，
我們更應該關注的
是這項研究中的那個開源的基礎模型。

其實在DeepSeek異軍突起之前，
全球的AI開源社區，
一直是以Meta的Llama系列，以及阿里的通義千問（Qwen）系列為首的，
尤其是阿里的通義千問，
可以說是整個開源社區中衍生模型最多的標桿基礎模型，
而最新的Qwen 2.5-Max，
更是在外網引發了不低的討論度，
熱度要遠高於國內，
在任意一條相關新聞下，
都能看到很多外國工程師在為中國的開源模型辯護。

為什麽？
很簡單，
未來的世界是AI的世界，
在這樣一個時代中，
“AI民主”就是人類最基本的人權，
為什麽AI的開源閉源一直爭論不休？
因為閉源的AI產品本質上，
就是一種AI壟斷，
每月200美元的o1，上千美元的o3，
都不是普通人能用得起的，
這個時候，
開源的通義千問和DeepSeek，
就為普通人帶來了可能。
我一直在說，
科技是來源於真實世界，
並且要為真實世界去服務的，
人工智能的不平凡，
其實是為了我們每一個平凡的人，
新的一年，
讓我們一起為中國AI加油。

易發睇樓團

【財經直播】Yahoo Money Talk

胡．說樓市

巴郡股東大會

Yahoo投資達人大賽2023

Yahoo 美股投資大賽