最近,DeepSeek在人工智能界掀起風暴,原因很簡單——它用遠低於市場標準的成本,訓練出一款效能不輸美國科技巨頭OpenAI的人工智能模型。情況就像一間小型車廠,用少於10%的資金,製造出一輛性能接近法拉利的跑車,當然會讓市場震驚。值得留意的是,DeepSeek究竟是怎麼做到的?是否真有突破性技術,還是單純地「抄功課」?這些問題讓許多人爭論不休。
要理解DeepSeek為甚麼能用這麼低的成本達到高效能,不妨用菜市場買菜的例子來說明。假設你每天都去市場買菜,一般人的做法可能是從頭到尾走一遍市場,看看各檔口的價格,然後決定在哪裡買最划算。但這樣做不僅花時間,還很費力。如果你經常去同一個市場,便會發現那些攤販賣的東西總是最便宜,或者那些攤販的蔬菜品質最好。於是你會調整策略,直接光顧那幾家檔口,不再浪費時間在市場裡四處尋找,這就是「提高效率」的方法。
DeepSeek的方法跟這很相似。傳統的AI模型在處理問題時,會讓整個系統一起運行,就像每次買菜都要繞遍整個市場那樣。但DeepSeek採用了「專家混合模型」(MoE,Mixture of Experts),也就是說,當AI需要解決一個問題時,它不會動用整個系統,而是「只找對的老闆買對的菜」,讓不同的AI 部分專門處理自己擅長的問題,其他部門則不必參與,從而節省大量算力和成本。
除了這種「選對老闆買菜」的方法,DeepSeek也懂得「記住價格」。一般AI在回答問題時,每次都要重新計算,就像你每次去市場都重新問一遍「蘿蔔幾錢斤?」。但DeepSeek會記住之前的計算結果,當你再問同樣的問題時,它不需要重新查一次,而是直接告訴你答案,從而大幅縮短運算時間,降低成本。
另一個關鍵技術則是「學習能力」。傳統AI每次運行時都像新手那樣從頭開始分析問題,但DeepSeek採用了強化學習(Reinforcement Learning),這就像是每天去市場買菜後,你會記住那條路線最短、那家攤販的價格最穩定,讓你的購物過程變得越來越快,甚至比一些老顧客更有效率。這樣的AI訓練方法,使得DeepSeek能夠在較短時間內達到較高的智能水平,進一步節省計算成本。
DeepSeek的成功並非發明了一種全新的AI,而是它學會如何用更少的資源做到跟OpenAI這樣的巨頭相似的效果。就像買菜一樣,不是改變蔬菜的種類,而是讓買菜的過程變得更有效率。這解釋了為甚麼DeepSeek能夠用相對較低的訓練成本,打造出一款與市場領先AI競爭的產品。
不過這同時引發另一個問題:DeepSeek的低成本是否意味著「偷師」了其他AI公司,尤其是OpenAI?這方面的爭議主要來自DeepSeek是否使用了 OpenAI模型的輸出作為訓練數據,也就是所謂的「蒸餾技術」(AI Distillation)。如果傳統的AI訓練方法是讓學生讀完整本百科全書,然後自己摸索如何回答問題,那麼蒸餾技術則更像是學生不讀整本書,而是直接從老師那裡獲得精讀筆記,並學習老師如何解題。這樣,學生既能節省學習時間,也能更快掌握解題技巧。DeepSeek就是用這種方式,通過較少的計算資源,學到了與OpenAI、Google這些巨頭相近的AI能力。
這種做法在技術層面上並不新鮮,因為OpenAI、Google甚至Meta也都使用類似的方法來提高自家模型的表現。爭議的焦點在於DeepSeek這樣的做法是否違反了OpenAI的服務條款?是否「竊取」了OpenAI的智慧成果?而 OpenAI自己也曾在訓練過程中使用大量從網絡上蒐集的數據,這些數據是否涉及其他人的版權?這些問題目前仍然沒有明確的法律共識。
AI技術的發展,從來都是各國科技競爭的重要戰場。美國企業主導了過去的發展,中國企業正在試圖突破,用自己的方式在技術上彎道超車。DeepSeek的出現,無論是否受到爭議,確實證明了AI不一定要依靠昂貴的設備和無限的計算資源才能發展。未來的AI競爭可能不是單純的「誰的晶片更快」,而是「誰更聰明地使用現有資源」,這將是影響科技產業的重要趨勢。
對於一般人來說,DeepSeek的技術突破意味AI可能會變得更加平民化,我們甚至可以在自己的電腦上運行高效能AI,而不必依賴大型科技公司的雲端服務。但這同時會帶來新的挑戰,例如如何保證私人AI訓練數據的合法性、如何應對私人AI在資訊管控方面的潛在問題,以及如何確保這些技術不會被濫用。隨著技術革命的推進,我們不僅要關注企業間的角力,更要思考如何在追求創新與規範之間找到平衡,確保AI技術能夠為全社會帶來真正的福祉。在AI日益普及的未來,我們每個人都可能成為這場變革的見證者,甚至參與者。