Top.Mail.Ru

Kandinsky 5: пайплайны данных, стек трэйна и инференса

Производительность
Архитектура и анализ

Тезисы

Поделюсь опытом команды Kandinsky Lab при работе над Kandinsky 5: как поднимать обучение больших генеративных моделей, имея доступ к нескольким GPU (не обязательно топовым).

Разберём, как организована обработка данных: распределённые воркеры, фильтрация, аннотирование, балансировка и выбор хранилища без I/O-бутылочных горлышек.

А также стек обучения: стратегии подгрузки в кластер, методы распределённого обучения и приёмы экономии памяти.


Ключевые темы и технологии

Python, Параллельные вычисления / GPU, Масштабируемость


Аудитория

Специалист по данным / Специалист по машинному обучению


Уровень сложности

Средний

Сбер
Андрей Романов

PhD по физике.

Работал в университете Эрлангена (Германия), развивал алгоритмами томографии электронного микроскопа. Занимался 3D-генерацией в Huawei (Новосибирск).

Другие спикеры трека Производительность