美國人工智能(AI)初創公司Anthropic推出名為Claude Sonnet 4.5的新一代前沿模型,稱這款生成式模型在編碼基準測試中展現出頂尖性能。
Claude Sonnet 4.5不僅能建構可投入生產使用的應用程式,而非僅停留在原型階段,其可靠性較此前的AI模型也實現質的飛躍。模型在編碼、電腦操作及滿足實際業務需求方面能力較強,同時在網路安全、金融、科研等專業領域中表現優異。
在一個關鍵基準測試中,Claude Sonnet 4.5一旦被分配任務,就可以連續自主運作30個小時,與Anthropic迄今為止最強版本Claude 4 Opus相比,這是一個顯著的飛躍,後者只能運行7個小時。
Anthropic表示,根據衡量AI系統軟件編碼能力的測試標準SWE-bench Verified等行業基準,Claude Sonnet 4.5堪稱全球最佳的電腦程式設計模型。