首页财产阐发评论ai正文 机能持平价格年夜降80%,Anthropic新模子杀疯了 距Claude Opus 4.6发布仅12天,Anthropic推出新中档模子Claude Sonnet 4.6,价格低机能优,还有开启印度市场,免费层级默许进级。 2026-02-19 11:30 ·微信公家号:字母榜苗正 AI投资人解读· Sonnet 4.6多项基准测试体现精彩,靠近或者逾越竞品,还有年夜幅晋升计较机利用能力,能完成繁杂使命,为企业节省成本;价格仅为竞品五分之一,运营成本可降至五分之一。 · 行业竞争加重,可能影响市场份额与盈利;技能成长快,模子机能可能快速迭代。 总结:Sonnet 4.6性价比高、机能优,具有投资潜力,但需存眷竞争与技能迭代危害,建议联合行业动态评估。内容由AI天生,仅供参考
间隔ClaudeOpus 4.6的发布仅已往12天,Anthropic就发布了新的中档模子Claude Sonnet 4.6。
此次发布的焦点不于在技能冲破自己,而于在它以低患上多的价格,到达了与竞品齐平的机能。。
Sonnet 4.6的订价连结于每一百万token输入3美元、输出15美元,与前代 Sonnet 4.5不异。
然而于多项基准测试中,Sonnet 4.6靠近甚至逾越了价格超出跨越五倍的Opus 4.6。
Anthropic暗示,自制纷歧定就没有好货。
固然了,于一些要害的测试里,仍旧还有是Opus 4.6*。
详细体现怎样呢?
01
Sonnet 4.6毕竟有多冷艳?
于SWE-bench Verified这个权衡真实软件编码能力的基准测试中,Sonnet 4.6患上分79.6%,险些追平Opus 4.6的 80.8%,同时略微*在OpenAI的GPT-5.2。
于代办署理式金融阐发使命中,Sonnet 4.6以63.3%的成就*所有竞争敌手,包括Opus 4.6的60.1%及GPT-5.2的59.0%。
于办公使命的GDPval-AA Elo评分中,Sonnet 4.6到达 1633 分,跨越Opus 4.6的1606分及GPT-5.2的1462分。
已往需要旗舰模子才能完成的使命,此刻用Sonnet 4.6这类中档模子就能做到。
对于在天天需要处置惩罚数百万token的企业来讲,这象征着可以年夜幅节省成本。
Opus 4.6仍旧于某些高繁杂度范畴连结上风。
于终端编码使命Terminal-Bench 2.0中,Opus 4.6患上分65.4%,Sonnet 4.6为59.1%。
于代办署理式搜刮BrowseComp中,Opus 4.6到达84.0%, Sonnet 4.6为74.7%。
于新奇问题解决测试ARC-AGI-2中,Opus 4.6患上分68.8%,Sonnet 4.6为58.3%。

这些差距注解,对于在前沿研究及需要*正确度的场景,Opus 4.6仍是*的模子。但对于在年夜大都出产情况,这个差距已经经缩小到可以接管的水平。
Sonnet 4.6最惹人注目的前进呈现于计较机利用能力上。于OSWorld-Verified基准测试中,它患上分72.5%,高在Sonnet 4.5的61.4%,远超GPT-5.2的38.2%。
计较机利用能力指的是AI像人类同样操作计较机的能力,经由过程鼠标点击、键盘输入来与软件交互,而不依靠API接口。
前一阵激发热议的豆包手机助手,其底层的UI-TARS模子,就是于OSWorld基准上完成为了权势巨子测试,取患了47.5%的成就。
豆包手机助手的体现长短常精彩的,已经经可以或许完成除了了付出之外所有的操作。
那末以此作为判定依据,进而不难推测,Sonnet 4.6的现实体现将会很是冷艳。
这项能力之以是主要,是由于它打开了最广泛的企业运用场景。
一个可以或许直接看屏幕并与之交互的模子,可以于不构建定制毗连器的环境下,主动操作将所有可交互的体系。
Anthropic于发布时提到,初期用户已经经看到靠近人类程度的体现,可以或许完成繁杂的电子表格使命及多步调网页表单。
保险科技公司Pace的CEO贾米·考夫(Jamie Cuffe)暗示,Sonnet 4.6于他们繁杂的保险计较机利用基准测试中到达94%的成就,是所有测试过的Claude模子中最高的。
他说:“它以咱们以前未见过的方式推理掉败缘故原由并自我改正。”
歹意举动者可能于网页中隐蔽指令来挟制模子,这被称为提醒注入进犯。
Anthropic于通知布告中暗示,Sonnet 4.6于抵御此类进犯方面比Sonnet 4.5有庞大改良。
对于在部署需要阅读网页及与外部体系交互的代办署理的企业来讲,这类安全防护是必需的。
02
价格只要五分之一
那末Sonnet 4.6到底有多自制呢?
外媒报导,一些初期的Sonnet 4.6用户暗示,原本企业需要花五倍的钱才能买到的能力,此刻用Sonnet 4.6就能得到差未几的效果。
这象征着运营成本可能直接降到本来的五分之一,而事情质量险些不受影响。
数据阐发平台Hex Technologies的CTO,同时也是Anthropic结合开创人、首席产物官的凯特琳-科尔格罗夫 (Caitlin Colgrove)说,公司正于将年夜部门流量迁徙到Sonnet 4.6。
她指出经由过程自顺应思索及高努力模式(high effort mode),“除了了最坚苦的阐发使命外,咱们于所有使命上都看到了Opus级另外机能,且配置更高效矫捷。以Sonnet的价格,这将降低事情成本。”
云存储公司Box的CTO本·喀什(Ben Kus)暗示,Sonnet 4.6于真实企业文档的重度推理问答中,比Sonnet 4.5的体现提高了15个百分点。
Sonnet 4.6配备了100万token的超长上下文窗口,以容纳整个代码库、法令文件或者数十篇研究论文。
Anthropic声称模子可以或许于整个上下文中有用推理,并经由过程Vending-Bench Arena这个基准测试来体现出Sonnet 4.6的有用推理。
Vending-Bench Arena测试的是模子运营模仿企业的能力,差别AI模子彼此竞争以得到*利润。

于没有人类提醒的环境下,Sonnet 4.6成长出一种新奇计谋:于前十个模仿月份中年夜量投资产能,支出远超竞争敌手,然后于末了阶段急转弯专注在盈利能力。
模子于365天模仿竣事时的余额约为5700美元,而Sonnet 4.5约为2100美元。
03
Anthropic开启印度市场
Anthropic正处在上市前最要害的阶段,是以他们不止要发布模子,还有要借着模子去扩张营业。
于Sonnet 4.6发布当天,印度IT巨头Infosys公布与Anthropic互助,构建企业级agent,将Claude模子集成到Infosys的Topaz AI平台中,办事在银行、电信及制造业。
与此同时,Anthropic也于印度的班加罗尔开设了*印度服务处,印度此刻占全世界Claude利用量的约6%,仅次在美国。
Anthropic的前进也致使了近来几天软件股的年夜范围抛售,就连事迹年夜涨的微软,也履历了股价狂跌。
投资者愈来愈担忧AI对于这些营业的潜于倾覆,Sonnet 4.6可能会加重这类不安的气氛。
也不知道是否是Anthropic飘了,他们还有将其免费层级默许进级到了Sonnet 4.6,开发者可以经由过程Claude API直接挪用。
【本文由投资界互助伙伴微信公家号:字母榜授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。
-雷火·竞技