Top.Mail.Ru

Фильтрация и логирование запросов в сторонние LLM (cursor, github copilot) от разработчиков с помощью LLM и apache apisix

Экспертный хаб

Тезисы

При интеграции корпоративных систем со сторонними LLM (OpenAI, Anthropic, Google и др.) возникает критический риск утечки чувствительных данных. Пользователи могут случайно отправить персональные данные, коммерческую тайну или другую конфиденциальную информацию в публичные LLM-сервисы.

Мы разработали и внедрили MVP сервиса фильтрации запросов к LLM, который автоматически обнаруживает и маскирует чувствительные данные перед отправкой к провайдерам LLM. Сервис построен на стеке APISIX (API Gateway), Guardrail (фильтрация и защита) и LiteLLM (унификация работы с различными LLM).

В докладе мы представим:

  • архитектуру решения для защиты данных при работе с LLM
  • практический опыт интеграции APISIX, Guardrail и LiteLLM
  • метрики производительности: время обработки < 100ms, блокировка ≥ 95% запросов с чувствительными данными
  • кейсы использования и пилотные внедрения
  • уроки, извлечённые при разработке и тестировании решения

Актуальность объясняется проблемой утечки данных при работе с LLM, которая касается всех компаний, интегрирующих AI в свои продукты. Наше решение может быть использовано и для внутренних нужд, и предложено внешним клиентам в качестве сервиса.


Ключевые темы и технологии

Использование AI


Аудитория

Использование AIБэкенд-разработчик, Фронтенд-разработчик, Технический директор / Архитектор


Уровень сложности

Средний

MTС Web Services
Михаил Бондаренко

В IT более 20 лет. Первый коммерческий опыт в веб-разработке получил ещё в школе, в 2004 году. С тех пор прошёл путь от веб-разработчика до руководителя разработки в BigData в MWS.

За эти годы успел поработать в разных форматах: запускал свой небольшой стартап, где отвечал за всё — от идеи до реализации; участвовал в стартапе, который делал seamless store (магазины без касс), — в нём занимался компьютерным зрением и бэкендом; сейчас руководит разработкой в направлении BigData в MWS.

Разбирается во всём стеке — от железа до архитектуры ПО. Писал на PHP, программирует на Python, немного на Go и C++, хорошо разбирается в Computer Vision, реализовал несколько CV-проектов от прототипа до продакшена. Главное преимущество — целостное понимание продукта на всех уровнях: от инфраструктуры до бизнес-логики.

Другие спикеры Экспертный хаб