Claude Sonnet 5 более эффективно планирует, взаимодействует с браузером и терминалом, а также выполняет сложные многошаговые задачи с минимальным человеческим вмешательством
Искусственный интеллект037 минут назад
Anthropic представила Claude Sonnet 5 — новую языковую модель из семейства Claude, которая в первую очередь ориентирована на агентные сценарии применения. По словам разработчиков, модель получила значительные улучшения в таких областях, как планирование, работа с внешними инструментами, программирование и выполнение сложных многошаговых задач, приближаясь по своим возможностям к значительно более дорогой модели Claude Opus 4.8.
В компании Anthropic подчеркивают, что именно модели класса Sonnet стали одними из первых широко используемых инструментов для разработки ИИ-агентов — систем, способных самостоятельно осуществлять последовательности действий, использовать браузер, терминал, API и другие внешние инструменты. Тем не менее, в последние месяцы наибольшие достижения в этой области демонстрировали более крупные модели семейства Opus. Claude Sonnet 5, по утверждению компании, значительно сокращает этот разрыв.
Разработчики сделали акцент на четырёх ключевых направлениях: логические рассуждения (reasoning), программирование, использование инструментов (tool use) и выполнение агентных задач. Согласно внутренним тестам Anthropic, Claude Sonnet 5 показывает значительное улучшение по сравнению с Claude Sonnet 4.6 и в некоторых сценариях достигает уровня производительности Claude Opus 4.8 при гораздо меньших вычислительных затратах.

Компания представляет результаты нескольких специализированных тестов, включая BrowseComp — бенчмарк для поиска и анализа информации, а также OSWorld-Verified — набор задач, имитирующих работу с реальным компьютером. По данным Anthropic, новая модель демонстрирует более высокую эффективность в соотношении производительности и стоимости, особенно при средних вычислительных затратах.
По отзывам участников программы раннего доступа, Claude Sonnet 5 лучше справляется с длительными задачами, которые предыдущие версии Sonnet часто оставляли незавершёнными. Разработчики также отмечают, что модель может самостоятельно проверять свои результаты и исправлять ошибки без прямых указаний от пользователя.
Отдельное внимание в Anthropic уделено вопросам безопасности. Согласно внутренним оценкам, Claude Sonnet 5 реже проявляет нежелательное поведение по сравнению с Claude Sonnet 4.6, лучше отклоняет вредоносные запросы и более устойчива к атакам типа prompt injection — методам, при которых злоумышленник пытается изменить поведение модели с помощью специально сформулированных инструкций. Кроме того, новая версия демонстрирует более низкий уровень галлюцинаций и меньшую склонность соглашаться с ошибочными утверждениями пользователей.

Anthropic также подчеркивает, что модель не была специально обучена для задач кибербезопасности. В тестах, связанных с разработкой программных эксплойтов и поиском уязвимостей, Claude Sonnet 5 показал значительно более слабые результаты по сравнению с Claude Opus 4.8. Тем не менее, компания включила для новой модели систему защиты от опасных киберсценариев по умолчанию.
Claude Sonnet 5 уже доступна пользователям всех тарифных планов Claude, включая Free и Pro, а также через Claude Code и API платформы Anthropic. До 31 августа 2026 года стоимость использования составит $2 за миллион входных токенов и $10 за миллион выходных токенов. После завершения промо-периода цена увеличится до $3 и $15 соответственно.
Darth SaharaИсточники:AnthropicИскусственный интеллект0Искусственный интеллектавтоматизацияAPIAnthropicLLMБольшие языковые моделиАгентыClaude Opus 4.8Claude Sonnet 5Reasoning37 минут назад
Источник