Kandinsky 5: пайплайны данных, стек трэйна и инференса

Производительность

Архитектура и анализ

Андрей Романов

Зал №7

Тезисы

Поделюсь опытом команды Kandinsky Lab при работе над Kandinsky 5: как поднимать обучение больших генеративных моделей, имея доступ к нескольким GPU (не обязательно топовым).

Разберём, как организована обработка данных: распределённые воркеры, фильтрация, аннотирование, балансировка и выбор хранилища без I/O-бутылочных горлышек.

А также стек обучения: стратегии подгрузки в кластер, методы распределённого обучения и приёмы экономии памяти.