Взрывной рост количества сгенерированных данных требует новых инструментов и парадигм по работе с ними.
В традиционных решениях, таких как Data Warehouse (DWH), данные поступают с опозданием, а в Data Lake тонут в своей неструктурированности.
В рамках мастер-класса мы рассмотрим архитектуру LakeHouse и все компоненты для его создания, использование которых позволяет комбинировать преимущества Data Lake и DWH, и построим рабочее решение на данных музыкального стриминг-сервиса.
Для активного участия в воркшопе нужен ноутбук и доступ в интернет. Однако, можно просто слушать, всё будет демонстрироваться на экране.
Trino, Clickhouse, iceberg
Бэкенд-разработчик, Специалист по данным/Специалист по машинному обучению, Технический директор / Архитектор
Средний
Больше семи лет строит аналитические системы и ускоряет процесс получения данных. Проводит тренинги по созданию архитектур данных для компаний. Автор курса по ClickHouse, построению витрин данных на Яндекс Практикум. Развивает облачные версии таких популярных инструментов, как ClickHouse, Kafka, Airflow, OpenSearch.