Строим LakeHouse в облаке

Мастер-класс
Проектирование, архитектура и системный анали
Базы данных

Тезисы

Взрывной рост количества сгенерированных данных требует новых инструментов и парадигм по работе с ними.

В традиционных решениях, таких как Data Warehouse (DWH), данные поступают с опозданием, а в Data Lake тонут в своей неструктурированности.

В рамках мастер-класса мы рассмотрим архитектуру LakeHouse и все компоненты для его создания, использование которых позволяет комбинировать преимущества Data Lake и DWH, и построим рабочее решение на данных музыкального стриминг-сервиса.


Ключевые темы и технологии

Trino, Clickhouse, iceberg


Аудитория

Backend-разработчик, Data Scientist / ML-инженер, CTO / Архитектор


Уровень сложности

Intermediate

Яндекс Облако
Кузьма Лешаков

Больше семи лет строит аналитические системы и ускоряет процесс получения данных. Проводит тренинги по созданию архитектур данных для компаний. Автор курса по ClickHouse, построению витрин данных на Яндекс Практикум. Развивает облачные версии таких популярных инструментов, как ClickHouse, Kafka, Airflow, OpenSearch.

Другие спикеры трека Мастер-класс