Anthropic剛剛宣布Claude Sonnet 4現已支持高達100萬Token的上下文窗口,容量是之前的5倍,開發者在單次請求中就能處理整個大型代碼庫(超過75,000行代碼)或數十篇研究論文

Sonnet 4的長上下文支持目前已在Anthropic API上向Tier 4和擁有自定義速率限制的客戶開放公測,并將在未來幾周內向更廣泛的用戶推出
詳細信息:
https://docs.anthropic.com/en/docs/build-with-claude/context-windows#1m-token-context-window
目前,Sonnet 4的長上下文功能已在亞馬遜Bedrock上作為公開測試版(public beta)提供,此外,該功能也即將登陸Google Cloud的Vertex AI平臺
用例
100萬Token的上下文窗口意味著Claude能夠處理和理解前所未有的信息量,從而支持更全面、數據更密集的復雜任務。開發者現在可以利用Claude實現以下高級用例:
大規模代碼分析: 將包含源文件、測試和文檔的完整代碼庫一次性加載給Claude。模型能夠深入理解項目架構,識別跨文件的依賴關系,并為整個系統的設計提出優化建議
海量文檔合成: 處理如法律合同、學術研究論文集或技術規范等大量文檔。Claude可以在保持完整上下文的情況下,分析數百份文檔之間的復雜關系
上下文感知智能體(Agent): 構建能夠在數百次工具調用和多步驟工作流中保持上下文的智能體。開發者可以向其提供完整的API文檔、工具定義和交互歷史,而無需擔心模型遺忘關鍵信息,從而保證了智能體行為的連貫性
全新定價模型與成本優化方案
為了應對處理超長上下文所需增加的計算資源,Anthropic為超過200K Token的提示(prompt)調整了定價。具體的定價結構如下:
|
提示長度 |
輸入價格 (每百萬Token) |
輸出價格 (每百萬Token) |
|---|---|---|
| ≤ 200K Tokens |
$3 |
$15 |
| > 200K Tokens |
$6 |
$22.50 |
Anthropic同時指出,開發者可以通過結合使用提示緩存(prompt caching)來降低長上下文應用的延遲和成本。此外,利用批處理(batch processing)功能處理100萬Token上下文的任務,還可額外節省50%的成本
價格:
https://www.anthropic.com/pricing#api
早期用戶好評如潮:解鎖生產級AI工程
此次更新已獲得早期合作伙伴的高度評價:金杯銀杯不如用戶的口碑
Bolt.new,一家將Claude集成到其瀏覽器開發平臺的公司,其聯合創始人兼CEO Eric Simons表示:“Claude Sonnet 4一直是他們代碼生成工作流的首選模型,其性能在生產環境中持續優于其他領先模型。現在有了100萬Token的上下文窗口,開發者可以在處理真實世界的大型項目時,依然保持所需的高準確性
iGent AI,一家總部位于倫敦、專注于將對話轉化為可執行代碼的軟件開發公司,其聯合創始人兼CEO Sean Ward也分享:曾經的不可能,如今已成現實。擁有100萬Token上下文的Claude Sonnet 4極大地增強了軟件工程智能體Maestro的自主能力。這一飛躍解鎖了真正的生產級工程——能夠在真實世界的代碼庫上進行持續數天的開發會話,從而在智能體軟件工程領域建立了一個新的范式