雷火·竞技-性能持平价格大降80%，Anthropic新模型杀疯了

首页财产阐发评论ai正文机能持平价格年夜降80%，Anthropic新模子杀疯了距Claude Opus 4.6发布仅12天，Anthropic推出新中档模子Claude Sonnet 4.6，价格低机能优，还有开启印度市场，免费层级默许进级。 2026-02-19 11:30 ·微信公家号：字母榜苗正 AI投资人解读· Sonnet 4.6多项基准测试体现精彩，靠近或者逾越竞品，还有年夜幅晋升计较机利用能力，能完成繁杂使命，为企业节省成本；价格仅为竞品五分之一，运营成本可降至五分之一。 · 行业竞争加重，可能影响市场份额与盈利；技能成长快，模子机能可能快速迭代。总结：Sonnet 4.6性价比高、机能优，具有投资潜力，但需存眷竞争与技能迭代危害，建议联合行业动态评估。内容由AI天生，仅供参考

间隔ClaudeOpus 4.6的发布仅已往12天，Anthropic就发布了新的中档模子Claude Sonnet 4.6。

此次发布的焦点不于在技能冲破自己，而于在它以低患上多的价格，到达了与竞品齐平的机能。。

Sonnet 4.6的订价连结于每一百万token输入3美元、输出15美元，与前代 Sonnet 4.5不异。

然而于多项基准测试中，Sonnet 4.6靠近甚至逾越了价格超出跨越五倍的Opus 4.6。

Anthropic暗示，自制纷歧定就没有好货。

固然了，于一些要害的测试里，仍旧还有是Opus 4.6*。

详细体现怎样呢？

Sonnet 4.6毕竟有多冷艳？

于SWE-bench Verified这个权衡真实软件编码能力的基准测试中，Sonnet 4.6患上分79.6%，险些追平Opus 4.6的 80.8%，同时略微*在OpenAI的GPT-5.2。

于代办署理式金融阐发使命中，Sonnet 4.6以63.3%的成就*所有竞争敌手，包括Opus 4.6的60.1%及GPT-5.2的59.0%。

于办公使命的GDPval-AA Elo评分中，Sonnet 4.6到达 1633 分，跨越Opus 4.6的1606分及GPT-5.2的1462分。

已往需要旗舰模子才能完成的使命，此刻用Sonnet 4.6这类中档模子就能做到。

对于在天天需要处置惩罚数百万token的企业来讲，这象征着可以年夜幅节省成本。

Opus 4.6仍旧于某些高繁杂度范畴连结上风。

于终端编码使命Terminal-Bench 2.0中，Opus 4.6患上分65.4%，Sonnet 4.6为59.1%。

于代办署理式搜刮BrowseComp中，Opus 4.6到达84.0%, Sonnet 4.6为74.7%。

于新奇问题解决测试ARC-AGI-2中，Opus 4.6患上分68.8%，Sonnet 4.6为58.3%。

这些差距注解，对于在前沿研究及需要*正确度的场景，Opus 4.6仍是*的模子。但对于在年夜大都出产情况，这个差距已经经缩小到可以接管的水平。

Sonnet 4.6最惹人注目的前进呈现于计较机利用能力上。于OSWorld-Verified基准测试中，它患上分72.5%，高在Sonnet 4.5的61.4%，远超GPT-5.2的38.2%。

计较机利用能力指的是AI像人类同样操作计较机的能力，经由过程鼠标点击、键盘输入来与软件交互，而不依靠API接口。

前一阵激发热议的豆包手机助手，其底层的UI-TARS模子，就是于OSWorld基准上完成为了权势巨子测试，取患了47.5%的成就。

豆包手机助手的体现长短常精彩的，已经经可以或许完成除了了付出之外所有的操作。

那末以此作为判定依据，进而不难推测，Sonnet 4.6的现实体现将会很是冷艳。

这项能力之以是主要，是由于它打开了最广泛的企业运用场景。

一个可以或许直接看屏幕并与之交互的模子，可以于不构建定制毗连器的环境下，主动操作将所有可交互的体系。

Anthropic于发布时提到，初期用户已经经看到靠近人类程度的体现，可以或许完成繁杂的电子表格使命及多步调网页表单。

保险科技公司Pace的CEO贾米·考夫（Jamie Cuffe）暗示，Sonnet 4.6于他们繁杂的保险计较机利用基准测试中到达94%的成就，是所有测试过的Claude模子中最高的。

他说：“它以咱们以前未见过的方式推理掉败缘故原由并自我改正。”

歹意举动者可能于网页中隐蔽指令来挟制模子，这被称为提醒注入进犯。

Anthropic于通知布告中暗示，Sonnet 4.6于抵御此类进犯方面比Sonnet 4.5有庞大改良。

对于在部署需要阅读网页及与外部体系交互的代办署理的企业来讲，这类安全防护是必需的。

价格只要五分之一

那末Sonnet 4.6到底有多自制呢？

外媒报导，一些初期的Sonnet 4.6用户暗示，原本企业需要花五倍的钱才能买到的能力，此刻用Sonnet 4.6就能得到差未几的效果。

这象征着运营成本可能直接降到本来的五分之一，而事情质量险些不受影响。

数据阐发平台Hex Technologies的CTO，同时也是Anthropic结合开创人、首席产物官的凯特琳-科尔格罗夫 (Caitlin Colgrove)说，公司正于将年夜部门流量迁徙到Sonnet 4.6。

她指出经由过程自顺应思索及高努力模式（high effort mode），“除了了最坚苦的阐发使命外，咱们于所有使命上都看到了Opus级另外机能，且配置更高效矫捷。以Sonnet的价格，这将降低事情成本。”

云存储公司Box的CTO本·喀什（Ben Kus）暗示，Sonnet 4.6于真实企业文档的重度推理问答中，比Sonnet 4.5的体现提高了15个百分点。

Sonnet 4.6配备了100万token的超长上下文窗口，以容纳整个代码库、法令文件或者数十篇研究论文。

Anthropic声称模子可以或许于整个上下文中有用推理，并经由过程Vending-Bench Arena这个基准测试来体现出Sonnet 4.6的有用推理。

Vending-Bench Arena测试的是模子运营模仿企业的能力，差别AI模子彼此竞争以得到*利润。

于没有人类提醒的环境下，Sonnet 4.6成长出一种新奇计谋：于前十个模仿月份中年夜量投资产能，支出远超竞争敌手，然后于末了阶段急转弯专注在盈利能力。

模子于365天模仿竣事时的余额约为5700美元，而Sonnet 4.5约为2100美元。

Anthropic开启印度市场

Anthropic正处在上市前最要害的阶段，是以他们不止要发布模子，还有要借着模子去扩张营业。

于Sonnet 4.6发布当天，印度IT巨头Infosys公布与Anthropic互助，构建企业级agent，将Claude模子集成到Infosys的Topaz AI平台中，办事在银行、电信及制造业。

与此同时，Anthropic也于印度的班加罗尔开设了*印度服务处，印度此刻占全世界Claude利用量的约6%，仅次在美国。

Anthropic的前进也致使了近来几天软件股的年夜范围抛售，就连事迹年夜涨的微软，也履历了股价狂跌。

投资者愈来愈担忧AI对于这些营业的潜于倾覆，Sonnet 4.6可能会加重这类不安的气氛。

也不知道是否是Anthropic飘了，他们还有将其免费层级默许进级到了Sonnet 4.6，开发者可以经由过程Claude API直接挪用。

【本文由投资界互助伙伴微信公家号：字母榜授权发布，本平台仅提供信息存储办事。】若有任何疑难，请接洽（editor@zero2ipo.com.cn）投资界处置惩罚。

-雷火·竞技