В докладе поделюсь современными техниками взлома мультиагентных ИИ-систем. Затронем современные техники джейлбрейка, промпт-инъекции, обход guardrail, самореплицирующиеся промпты и заражение агентов по цепочке. Разберём, как архитектура мультиагентов (swarm/supervisor) влияет на векторы атак и почему мультиагентные системы ломаются интереснее и непредсказуемее одиночных агентов. Коротко остановимся на свежих реальных кейсах вроде OpenClaw.
Весь материал будет наглядно представлен на live-демо в моковом приложении.
AI Безопасность, AI-агенты и агентские системы
Backend-разработчик, QA-инженер / Тестировщик, CTO / Архитектор Уровень
Средний
Руководитель направления внедрения ИИ-агентов в компании АМА. Лидирует команду инженеров, вместе с которой автоматизируют работу сотрудников, экономят компании миллионы рублей и внедряют передовые мультиагентные системы.
В качестве хобби участвует в развитии практик киберзащиты. Любит пентестить LLM, ломать AI-агентов и пробовать новые технологии.