+7 (495) 123 45 67
+7 (495) 123 45 67
03.04.2025
Время на чтение: N минут
>> Поделиться статьёй

Аналитическая платформа для онлайн-маркетплейсов

Оптимизация DWH на Clickhouse и кластеров PostgreSQL снимает ограничения роста бизнеса
Clickhouse
Data Platform
О клиенте

Российская платформа для развития бизнеса на цифровых маркетплейсах типа Ozon.

500K+ бизнесов получают аналитику для цифровых маркетплейсов на этой платформе: следят за продажами, находят новые ниши, исследуют конкурентов. Бесперебойная работа с данными критична для выживания и успеха платформы.

Проблема

Сбои в работе с данными блокируют рост аналитической платформы

 

Хранение и обработку данных платформы реализует DWH на базе Clickhouse и кластера PostgreSQL в публичном облаке. Популярность платформы растёт, вместе с ней растёт и нагрузка на DWH. К концу 2022 года это стало приводить к сбоям, возникли финансовые и репутационные риски.

Первые проблемы ещё не казались серьёзными. Для устранения отдельных сложностей с Clickhouse пригласили Fevlake. Однако дата-архитекторы Fevlake выявили глобальные проблемы работы с данными, которые в будущем могли парализовать рост бизнеса. Проблемы с Clickhouse были первым звонком. Требовалось срочно понять, как реорганизовать работу с данными, чтобы исключить сбои в растущей инфраструктуре.

Решение

Глубокий аудит и точечный рефакторинг

Мы провели аудит конфигураций DWH, структур данных, типичных запросов и обнаружили ряд проблем:

→ Неоптимальная схема и логика хранения данных, избыточная логика работы с данными.

→ Некорректные запросы в СУБД.

→ Неоптимальное использование дискового пространства, приводящее к существенному повышению расходов.

→ Низкая скорость взаимодействия приложений с СУБД PostgreSQL.

→ Низкая скорость формирования аналитики для клиентов платформы в большинстве сценариев взаимодействия с DWH.

→ Повышенная аварийность решений для хранения данных: Clickhouse и PostgreSQL.

 

С фокусом на этих узких местах мы выработали более стабильную архитектуру хранения данных и конфигурации кластеров Clickhouse и PostgreSQL. Мы внедрили новые конфигурации и мигрировали данные в обновлённые кластера в плановом режиме, с минимальным влиянием на работу бизнеса.

Устранив непосредственные риски сбоев, мы дополнительно оптимизировали утилизацию ресурсов. Для снижения нагрузки на кластеры СУБД и расходов мы задействовали холодное хранилище на базе S3.

Результаты

Стабилизация инфраструктуры работы с данными

За период с января по ноябрь 2023 года мы:

Снизили в течение первого же месяца аварийность СУБД, аптайм доведён до 99.95%.
99,95%
Построили новую архитектуру DWH с возможностью бесконечной масштабируемости нагрузки без потери производительности.
Data
Добились прироста производительности в работе аналитики, что улучшило опыт пользователей.
прирост
Оптимизировали совокупную стоимость DWH на 20%.
20%
Реализовали отказоустойчивую архитектуру конфигурации кластеров СУБД.

Объём данных и производительность DWH

Перед стартом работ (январь 2023)
Перед стартом работ (январь 2023)
1 PostgreSQL-кластер: общий объем данных — 0.5 ТБайт
1 ClickHouse-кластер: общий объем данных — 3 ТБайт
В настоящий момент (июнь 2024)
В настоящий момент (июнь 2024)
2 PostgreSQL-кластера: общий объем данных — 8 ТБайт, совокупная пиковая нагрузка 4.000 транзакций/сек
2 ClickHouse-кластера: общий объем данных — 16 ТБайт, обновление 700млн+ строк/сут

123

123

123

123

Оставить запрос

    Наши блоги и публикации

    Выступаем на эвентах и
    организовываем собственные

    Root Conf

    Root Conf

    DevOps Conf

    DevOps Conf

    DevOps by Rebrain

    DevOps by Rebrain

    Yandex

    Yandex