Китайская Zhipu AI представила GLM-5.2 — прорыв в поиске уязвимостей

Новая открытая модель достигла уровня Anthropic и OpenAI в области кибербезопасности, вызывая беспокойство в США о распространении мощных технологий ИИ

Искусственный интеллект113:09

Китайская компания Zhipu AI (также известная как Z.ai) представила открытую модель GLM-5.2 с доступными весами, которая, по утверждениям ряда исследователей, в некоторых ситуациях сопоставима с передовыми моделями западных разработчиков в области поиска программных уязвимостей и кибербезопасности.

Модель представляет собой систему с открытыми весами, которые можно загружать и запускать локально на стандартном оборудовании. Такой подход позволяет разработчикам и энтузиастам свободно использовать модель, адаптировать её под специфические задачи и запускать без необходимости обращений к облачным сервисам.

Согласно исследовательским данным, GLM-5.2 показывает результаты, близкие к моделям Anthropic и OpenAI в ряде специализированных сценариев, связанных с анализом кода и обнаружением уязвимостей. Однако в более общих задачах, таких как диалоговое взаимодействие и сложные рассуждения, модель, по оценкам, всё ещё уступает ведущим западным системам.

Изображение сгенерировано: Nano Banana

Согласно данным, опубликованным компанией Semgrep, автором security-бенчмарка и методологии тестирования LLM на уязвимости, модель продемонстрировала около 39% F1 в задаче обнаружения IDOR-уязвимостей, превзойдя Claude Code (примерно 32–37% в зависимости от конфигурации), но уступив специализированным пайплайнам с расширенной инфраструктурой анализа (до 53–61% F1). В тестах использовался единый промпт без дополнительного «harness-обвеса» для open-weight моделей.

Важно отметить, что результаты не следует рассматривать как прямое сравнение общей «интеллектуальной» способности моделей: значительная часть различий обусловлена не самой моделью, а вспомогательной системой выполнения задач, включая навигацию по коду и контекстуальную обработку.

Независимый исследовательский контур, анализирующий поведение моделей и сравнивающий результаты бенчмарков, Graphistry, также отмечает высокую корреляцию паттернов ошибок GLM-5.2 с результатами ряда закрытых моделей, включая Claude и GPT-5.5, что в некоторых анализах интерпретируется как возможный признак дистилляции, однако прямых доказательств этому не представлено — речь идёт о статистических наблюдениях.

С практической точки зрения модель демонстрирует низкую стоимость применения: в одной из конфигураций Semgrep оценил стоимость обнаружения одной уязвимости примерно в $0.17, что делает её одной из самых экономически выгодных среди сопоставимых решений в тесте.

Исследователи подчеркивают, что открытая доступность подобных моделей снижает порог входа для автоматизации атакующих сценариев, поскольку позволяет запускать и адаптировать инструменты поиска уязвимостей локально, без ограничений со стороны провайдера.

Источник: Semgrep

Факт уменьшения разрыва в критически важных областях вызывает беспокойство в США. В материале подчеркивается, что американские власти рассматривают такие модели как потенциальный фактор национальной безопасности, особенно в контексте их возможного использования для автоматизированного поиска уязвимостей в программном обеспечении.

Особое внимание уделяется тому, что open-weight характер GLM-5.2 делает её особенно доступной для широкой аудитории пользователей. В отличие от закрытых облачных моделей, такие системы можно запускать локально без централизованного контроля со стороны разработчика. Это расширяет возможности исследователей и компаний, но одновременно снижает уровень контроля над потенциально опасными сценариями использования.

Развитие мощных моделей ИИ всё чаще выходит за пределы закрытых коммерческих систем.

Darth SaharaИсточники:the vergeSemgrepGraphistryИскусственный интеллект1Искусственный интеллектКибербезопасностьOpenAIКитайСШАAnthropicLLMZhipu AIZ.aiGLM-5.2Open-weight модели13:09

Источник