Claude3.7登顶webdev榜首 Claude 3.7 Sonnet 以 1363.7分 的竞技场评分位列榜首,较第二名(同为Anthropic的Claude 3.5 Sonnet)甩开116.5分,远超榜单前十其他模型的分差水平(通常仅相差几分至几十分)。 相较于Claude 3.5 Sonnet,Claude 3.7 Sonnet性能提升与基准测试中有下面两点优势。 数学与编码能力:相较于Claude 3.5 Sonnet,数学问题解决能力提升10%以上,在Agentic Coding(代理编码)测试中以…