Top.Mail.Ru

Телефония и браузерный агент для AI-агентов

Лаборатория

Тезисы

Современные AI-агенты умеют генерировать текст, но не могут позвонить человеку или сами нажать кнопку в браузере. Чтобы агент стал полезным в реальном мире, ему нужны «руки и уши» — инструменты для выхода за пределы чата.

В этом мастер-классе мы покажем два таких инструмента от платформы GigaChat:

  • сервис-технический энейблер для голосового общения LLM с абонентами по телефону (исходящие и входящие звонки, обход голосовых меню, тональный набор, вызов функций по контексту)
  • браузерный агент с облачным браузером (live-stream, remote control), который может искать информацию, заполнять формы, кликатьМы разберём архитектуру, API, политики recovery/retry, а затем перейдём к практике: участники на своих ноутбуках подключатся к API сервиса и увидят, как их собственный агент может позвонить и выполнить сценарий (например, уточнить информацию или обработать жалобу). Также покажем end-to-end пример: браузерный агент ищет телефон в интернете → другой агент звонит по этому номеру и общается с абонентом для выполнения задачи.

В конце — доступ к API сервиса для звонков и облачному браузеру для самостоятельного тестирования и готовый код-пример для интеграции в агентов на Claude или других LLM.

Обязательно с собой: Ноутбук


Ключевые темы и технологии

Использование AI, AI-агенты и агентские системы


Аудитория

Для всех


Уровень сложности

Начальный

Сбер
Диана Гердт

Системный аналитик с пятилетним опытом: четыре года в электроэнергетике (микросервисы, интеграции, телеметрия, автоматизация), последний год занимается разработкой AI-агентов (браузерный агент, LLM-телефония) в Сбере.

Сбер
Татьяна Фёдорова

Системный аналитик с опытом в российском бигтехе (Сбер, МТС Travel). Разработка браузерного AI-агента для автоматизации задач и платформенных компонентов.

Другие спикеры Лаборатория