Top.Mail.Ru

Взлом мультиагентных ИИ-систем: современные техники на практике

Безопасность
ИИ в разработке ПО

Тезисы

В докладе поделюсь современными техниками взлома мультиагентных ИИ-систем. Затронем современные техники джейлбрейка, промпт-инъекции, обход guardrail, самореплицирующиеся промпты и заражение агентов по цепочке. Разберём, как архитектура мультиагентов (swarm/supervisor) влияет на векторы атак и почему мультиагентные системы ломаются интереснее и непредсказуемее одиночных агентов. Коротко остановимся на свежих реальных кейсах вроде OpenClaw.

Весь материал будет наглядно представлен на live-демо в моковом приложении.


Ключевые темы и технологии

AI Безопасность, AI-агенты и агентские системы


Аудитория

Backend-разработчик, QA-инженер / Тестировщик, CTO / Архитектор Уровень


Уровень сложности

Средний

АМА
Александр Князев

Руководитель направления внедрения ИИ-агентов в компании АМА. Лидирует команду инженеров, вместе с которой автоматизируют работу сотрудников, экономят компании миллионы рублей и внедряют передовые мультиагентные системы.

В качестве хобби участвует в развитии практик киберзащиты. Любит пентестить LLM, ломать AI-агентов и пробовать новые технологии.

Другие спикеры трека Безопасность