S3 с максимальной доступностью: как отключить целый дата-центр с данными и не пострадать

Проектирование, архитектура и системный анализ
Проектирование, архитектура и системный анализ
Зал №5

Тезисы

В Ozon мы стараемся строить инфраструктуру исходя из принципа максимальной доступности. Мы хотим не переживать, не только когда выходит из строя один диск или один хост, — мы хотим быть уверены в доступности наших сервисов даже при отключении целого дата-центра. И чтобы в этом убедиться, регулярно проводим учения и испытания.

Для stateless-сервисов в Kubernetes подход типичный и достаточно понятный. Но что делать, если нужно обеспечить те же требования для больших объектных хранилищ? Как гарантировать доступность десятков или даже сотен петабайт данных в S3? Я расскажу, как мы этого добились и как проводим учебные отключения дата-центра для нашего S3-хранилища.


Ключевые темы и технологии

Object Storage, S3, Ceph


Аудитория

Backend-разработчик, Team Lead / Engineering Manager, CTO / Архитектор


Уровень сложности

Средний

Проектирование, архитектура и системный анализ
Зал №5
Ozon
Максим Харитонов

Работает в платформе Ozon tech. Вместе с командой занимается созданием и развитием хранилищ данных.

Направления профессиональных интересов: объектные S3-совместимые хранилища; блочные хранилища; применение их для задач быстрого доступа к данным или, наоборот, для долговременных холодных бекапов.

Другие спикеры трека Проектирование, архитектура и системный анализ

Еще на тему Проектирование, архитектура и системный анализ