【杜蘭說AI】中國開源模型 AI平權的希望
1,537 次觀看
太快了,
又一個國產開源大模型殺出來了,
在各大主流榜單全面超越DeepSeek V3和o1-mini,
著名的AI教母李飛飛,
甚至基於這一基礎模型,
50美元成本就做了一個DeepSeek。
它就是國產開源模型的老大哥,
阿里通義千問。
在今年春節前夕,
最新版本Qwen 2.5-Max發布,
又給全球AI圈狠狠加了一把火。
首先給大家辟個謠,
我開頭說的李飛飛團隊的研究,
號稱26分鐘,50美元就訓練出了媲美DeepSeek R1的模型,
這個看著低得嚇人的成本,
應該只是外界預估的雲計算費用。
我去翻了下論文,
里面開篇就表明,
他們是在通義千問模型的基礎上監督微調得來的,
並不是從零造模型。
所以說,
我們更應該關注的
是這項研究中的那個開源的基礎模型。
其實在DeepSeek異軍突起之前,
全球的AI開源社區,
一直是以Meta的Llama系列,以及阿里的通義千問(Qwen)系列為首的,
尤其是阿里的通義千問,
可以說是整個開源社區中衍生模型最多的標桿基礎模型,
而最新的Qwen 2.5-Max,
更是在外網引發了不低的討論度,
熱度要遠高於國內,
在任意一條相關新聞下,
都能看到很多外國工程師在為中國的開源模型辯護。
為什麽?
很簡單,
未來的世界是AI的世界,
在這樣一個時代中,
“AI民主”就是人類最基本的人權,
為什麽AI的開源閉源一直爭論不休?
因為閉源的AI產品本質上,
就是一種AI壟斷,
每月200美元的o1,上千美元的o3,
都不是普通人能用得起的,
這個時候,
開源的通義千問和DeepSeek,
就為普通人帶來了可能。
我一直在說,
科技是來源於真實世界,
並且要為真實世界去服務的,
人工智能的不平凡,
其實是為了我們每一個平凡的人,
新的一年,
讓我們一起為中國AI加油。