台灣鴻海集團推出自有大語言模型,該模型具有推理能力,由公司內部開發,僅用4周時間完成了訓練;雖與DeepSeek的蒸餾模型仍有些微差距,但表現已相當接近世界領先水準。
該集團旗下的鴻海研究院公布,推出首款繁體中文AI大型語言模型(LLM),內部開發代碼FoxBrain,此模型原為內部應用而設計,涵蓋數據分析、決策輔助、文書協作、數學、推理解題與代碼生成等功能,後續將對外開源分享。該公司預計,FoxBrain將推動AI在製造業和供應鏈管理領域的應用。
在FoxBrain訓練過程中,使用120張輝達(Nvidia)H100 GPU,並透過輝達(Nvidia)Quantum-2 InfiniBand網路進行擴展,僅花約4周的時間完成,相較於近期其他公司所推出的推理模型,以更高效率,更低成本的模型訓練方式為台灣AI技術發展樹立新里程碑。
鴻海表示,輝達提供了其台灣超級電腦的支持和技術諮詢,使模型訓練取得成功。