摘要: Anthropic周一發(fā)布名為Claude 3.7 Sonnet的模型,稱這種混合型模型同時具備推理模式(停下來思考復(fù)雜答案)與標準模式(實時生成答案)的能力。 Anthropic稱,Claud
Anthropic周一發(fā)布名為Claude 3.7 Sonnet的模型,稱這種“混合型”模型同時具備“推理模式”(停下來思考復(fù)雜答案)與標準模式(實時生成答案)的能力。
Anthropic稱,Claude 3.7 Sonnet是市面上唯一的此類“混合”模型,并將立即投入使用。Kaplan將其比作人類大腦的運行方式:有的問題需要深度思考,有的問題需要快速作答。但Anthropic希望將這兩種能力整合在同一個模型中,而不是完全分開。
在標準模式下,Claude 3.7 Sonnet 是 Claude 3.5 Sonnet 的升級版。
在擴展思維模式下,它會在回答前進行自我反思,從而提高其在數(shù)學(xué)、物理、指令遵循、編碼和許多其他任務(wù)上的表現(xiàn)。
在開發(fā)推理模型時,Anthropic對數(shù)學(xué)和計算機科學(xué)競賽問題的優(yōu)化較少,而是將重點轉(zhuǎn)向更能反映企業(yè)實際如何使用 LLM 的現(xiàn)實任務(wù)。
早期測試表明,Claude 在編碼能力方面全面領(lǐng)先:Cursor 指出,Claude 在實際編碼任務(wù)中再次名列前茅,在處理復(fù)雜代碼庫和高級工具使用等領(lǐng)域都有顯著改進。Cognition 發(fā)現(xiàn),在規(guī)劃代碼更改和處理全棧更新方面,Claude 遠勝于任何其他模型。Vercel 強調(diào)了 Claude 在復(fù)雜代理工作流程中的精確度,而 Replit 已成功部署 Claude 從頭開始構(gòu)建復(fù)雜的 Web 應(yīng)用程序和儀表板,而其他模型則停滯不前。在 Canva 的評估中,Claude 可生成具有卓越設(shè)計品味的生產(chǎn)就緒代碼,并減少了錯誤。
Claude 3.7 Sonnet 在指令遵循、一般推理、多模態(tài)能力和代理編碼方面表現(xiàn)出色,擴展思維在數(shù)學(xué)和科學(xué)方面提供了顯著的提升。除了傳統(tǒng)的基準測試之外,它甚至在Pokémon 《精靈寶可夢》游戲測試中超越了所有以前的模型。
與此同時,媒體報道稱,Anthropic即將完成一輪35億美元的融資,公司估值將達到615億美元。公司本輪融資的最初目標為20億美元,但在談判期間成功說服投資者增加投資。本輪融資的參與者包括Lightspeed Venture Partners、General Catalyst和Bessemer Venture Partners,總部位于阿布扎比的投資公司MGX正在洽談參與事宜。
在此此前,亞馬遜已向Anthropic累計投資80億美元,而谷歌母公司Alphabet已向其投資20億美元。
原標題:奧運冠軍全紅嬋,擬保送暨南大學(xué)! 2月24日,暨南大學(xué)公示2025年優(yōu)秀
快資訊2025-02-25 19:48:28
原標題:復(fù)旦大學(xué)通報博士后抄襲論文:情節(jié)嚴重 作退站處理 近日,有網(wǎng)友發(fā)
快資訊2025-02-25 19:11:53
原標題:100億!《哪吒2》背后是一個新系統(tǒng)的勝利 100億! 《哪吒2》到底做對
快資訊2025-02-14 19:13:38
原標題:真奇葩!收700多元作業(yè)打印費,山西太原一中學(xué)沖上熱搜 在信息傳播
快資訊2025-02-14 18:50:48
原標題:《哪吒2》火到國外,激活一個高校專業(yè),動畫專業(yè)擇校策略 近年來,
快資訊2025-02-12 20:30:03