Взрывной рост количества сгенерированных данных требует новых инструментов и парадигм по работе с ними.
В традиционных решениях, таких как Data Warehouse (DWH), данные поступают с опозданием, а в Data Lake тонут в своей неструктурированности.
В рамках мастер-класса мы рассмотрим архитектуру LakeHouse и все компоненты для его создания, использование которых позволяет комбинировать преимущества Data Lake и DWH, и построим рабочее решение на данных музыкального стриминг-сервиса.
Trino, Clickhouse, iceberg
Backend-разработчик, Data Scientist / ML-инженер, CTO / Архитектор
Intermediate
Больше семи лет строит аналитические системы и ускоряет процесс получения данных. Проводит тренинги по созданию архитектур данных для компаний. Автор курса по ClickHouse, построению витрин данных на Яндекс Практикум. Развивает облачные версии таких популярных инструментов, как ClickHouse, Kafka, Airflow, OpenSearch.