lumen

Cloudera Data Platform

Решения на базе Cloudera Data Platform

Особенности:

  • Мультиплатформенность (облачные и on-premise среды)

  • Мультифункциональность (DWH, DS/ML, Real-Time Streaming, Integration)

  • Универсальные политики безопасности и управления данными

  • Гибкая и открытая архитектура с набором open source компонентов

Cloudera Data Platform — объединяет в себе лучшие технологии от HortonWorks и Cloudera на базе Apache Hadoop и является первым универсальным облаком данных уровня предприятия. CDP представляет собой многокомпонентное и многофункциональное решение и предоставляет большие возможности по self-service аналитике в гибридных и мультиоблачных средах, а также сложные и детализированные политики безопасности и управления данными.

CDP

Компоненты для управления платформой CDP

Преимущества

  • Отсутствие зависимости от конкретного облачного провайдера
  • Решение любых задач по хранению, обработке и аналитике данных
  • Снижение расходов на IT засчет унифицированного управления средами и кластерами
  • Уменьшение time-to-market для продуктов компании засчет self-service аналитики без привлечения IT
  • Постоянно расширяемая открытая платформа засчет новых компонентов
  • SDX — набор внутренних сервисов для управления метаданными, миграцией, безопасностью и каталогом данных
  • MANAGEMENT CONSOLE — единый инструмент управления кластерами во всех средах
  • DATA CATALOG — инструмент централизованного управления данными для поиска, организации, защиты и управления данными в разных средах
  • WORKLOAD MANAGER — инструмент централизованного управления для анализа и оптимизации загрузки ресурсов внутри и между средами
  • REPLICATION MANAGER — инструмент централизованного управления для репликации и переноса данных, метаданных и политик между средами

Компоненты для хранения, обработки и анализа данных на платформе CDP

  • DATA WAREHOUSE — высокопроизводительное хранилище для BI и SQL аналитики
  • OPERATIONAL DATABASE — обработка реляционных или NoSQL данных в структурированном и неструктурированном виде
  • DATA ENGINEERING — streaming/batch обработка данных и ETL
  • MACHINE LEARNING — рабочая среда для специалистов по машинному обучению
  • DATA HUB — классический кластер с широкими возможностями по настройке и оптимизированный для разделения на зоны хранения и вычислений
  • DATA FLOW — масштабируемая платформа потоковой аналитики в режиме реального времени
  • CLOUDERA RUNTIME — набор базовых сервисов Apache Hadoop