Решения на базе Cloudera Data Platform
Особенности:
Мультиплатформенность (облачные и on-premise среды)
Мультифункциональность
(DWH, DS/ML, Real-Time Streaming, Integration)
Универсальные политики безопасности и управления данными
Гибкая и открытая архитектура с набором open source компонентов
Cloudera Data Platform — объединяет в себе лучшие технологии от HortonWorks и Cloudera на базе Apache Hadoop и является первым универсальным облаком данных уровня предприятия.
CDP представляет собой многокомпонентное и многофункциональное решение и предоставляет большие возможности по self-service аналитике в гибридных и мультиоблачных средах, а также сложные и детализированные политики безопасности и управления данными.

Компоненты для управления платформой CDP
Преимущества
- Отсутствие зависимости от конкретного облачного провайдера
- Решение любых задач по хранению, обработке и аналитике данных
- Снижение расходов на IT засчет унифицированного управления средами и кластерами
- Уменьшение time-to-market для продуктов компании засчет self-service аналитики без привлечения IT
- Постоянно расширяемая открытая платформа засчет новых компонентов
- SDX — набор внутренних сервисов для управления метаданными, миграцией, безопасностью и каталогом данных
- MANAGEMENT CONSOLE — единый инструмент управления кластерами во всех средах
- DATA CATALOG — инструмент централизованного управления данными для поиска, организации, защиты и управления данными в разных средах
- WORKLOAD MANAGER — инструмент централизованного управления для анализа и оптимизации загрузки ресурсов внутри и между средами
- REPLICATION MANAGER — инструмент централизованного управления для репликации и переноса данных, метаданных и политик между средами
Компоненты для хранения, обработки и анализа данных на платформе CDP
- DATA WAREHOUSE — высокопроизводительное хранилище для BI и SQL аналитики
- OPERATIONAL DATABASE — обработка реляционных или NoSQL данных в структурированном и неструктурированном виде
- DATA ENGINEERING — streaming/batch обработка данных и ETL
- MACHINE LEARNING — рабочая среда для специалистов по машинному обучению
- DATA HUB — классический кластер с широкими возможностями по настройке и оптимизированный для разделения на зоны хранения и вычислений
- DATA FLOW — масштабируемая платформа потоковой аналитики в режиме реального времени
- CLOUDERA RUNTIME — набор базовых сервисов Apache Hadoop