Top.Mail.Ru

Строим LakeHouse в облаке

Мастер-классы
Архитектура и анализ
Базы данных

Тезисы

Взрывной рост количества сгенерированных данных требует новых инструментов и парадигм по работе с ними.

В традиционных решениях, таких как Data Warehouse (DWH), данные поступают с опозданием, а в Data Lake тонут в своей неструктурированности.

В рамках мастер-класса мы рассмотрим архитектуру LakeHouse и все компоненты для его создания, использование которых позволяет комбинировать преимущества Data Lake и DWH, и построим рабочее решение на данных музыкального стриминг-сервиса.


Ключевые темы и технологии

Trino, Clickhouse, iceberg


Аудитория

Бэкенд-разработчик, Специалист по данным/Специалист по машинному обучению, Технический директор / Архитектор


Уровень сложности

Средний

Яндекс Облако
Кузьма Лешаков

Больше семи лет строит аналитические системы и ускоряет процесс получения данных. Проводит тренинги по созданию архитектур данных для компаний. Автор курса по ClickHouse, построению витрин данных на Яндекс Практикум. Развивает облачные версии таких популярных инструментов, как ClickHouse, Kafka, Airflow, OpenSearch.

Другие спикеры Мастер-классы