Neue Services für die Cloudera Data Platform

München, 22. September 2020 —

Cloudera (NYSE: CLDR), das Unternehmen hinter der Enterprise Data Cloud, stellt neue Cloud-Dienste für Unternehmensdaten vor: CDP Data Engineering, CDP Operational Database und CDP Data Visualization sind bald über die Cloudera Data Platform (CDP) verfügbar. Diese Analyse-Services enthalten Schlüsselfunktionen wie Workflow-Automatisierung, Job-Priorisierung und Leistungsabstimmung und unterscheiden sich damit von Allzweckdiensten, die dafür Add-Ons erfordern. So können Dateningenieure, Datenanalytiker und Datenwissenschaftler intelligenter und schneller arbeiten. CDP Enterprise Data Cloud Services sollen helfen, das exponentielle Datenwachstum und die Analyse von Daten, die sich über mehrere Silos in öffentlichen und privaten Clouds hinweg erstrecken, sicher zu meistern.

Unternehmen stehen vor radikalen Veränderungen, die die globale Pandemie noch verstärkt. Die Digitalisierung hat Einzug genommen, vom persönlichen Treffen bis hin zum Einkauf von Lebensmitteln. Infolgedessen generieren Unternehmen mehr Daten als je zuvor – und zwar an jedem Punkt ihrer Geschäftstätigkeit. Kontakte mit Mitarbeitern, Kunden und Partnern sind virtuell, wodurch es mehr digitale Transaktionen zu verfolgen und zu überwachen gilt. Dies birgt jedoch auch die Chance, Geschäftsentscheidungen besser und schneller zu treffen. Die Grundlage dafür bildet die CDP, die ohne Limitierung hinsichtlich Menge oder Format Daten für Analysen heranziehen kann – aus jeder Phase des Datenlebenszyklus.

Daten effektiv zu verwalten und zu sichern, sie anzureichern, zu analysieren, damit zu experimentieren und die Analysen zu visualisieren, ist von grundlegender Bedeutung, um durch die Datenflut navigieren zu können. Durch die Integration des Datenlebenszyklus arbeiten Dateningenieure, -analytiker und -wissenschaftler sicher und effizient an denselben Daten – unabhängig davon, wo sich diese Informationen befinden oder wo die Analysen ausgeführt werden. Die CDP verbessert nicht nur die Produktivität einzelner Spezialisten, sondern hilft auch Teams während des gesamten Datenlebenszyklus und über verschiedene Clouds hinweg besser zusammenzuarbeiten. Das beschleunigt datengestützte Anwendungsfälle, etwa im Bereich der vorausschauenden Wartung oder der 360°-Sicht auf den Kunden, mit denen Unternehmen ihre Wettbewerbsfähigkeit erhöhen oder ihre Kunden besser betreuen können.

„Unsere Kunden wissen, wie wichtig die Betrachtung des gesamten Datenlebenszyklus dafür ist, um im gesamten Unternehmen datengestützte Entscheidungsfindungen voranzutreiben. Sie integrieren traditionell Datencluster für NiFi, Kafka, Spark, Impala, Hive, HBase und mehr“, sagt Arun Murthy, Chief Product Officer von Cloudera. „Das können Datenspezialisten wie Architekten und Entwickler mit unserem CDP Data Hub auch weiterhin. Dateningenieure, -analytiker und -wissenschaftler erhalten mit CDP Analytic Experiences jetzt genau das, was sie brauchen, um besser arbeiten zu können, ohne Cluster verstehen oder verwalten zu müssen. Die eingebaute Sicherheit und Governance über den gesamten Datenlebenszyklus macht es darüber hinaus der IT-Abteilung leichter. Es ist eine einzige Enterprise Data Cloud, die für alle funktioniert.“

CDP Data Engineering

CDP Data Engineering ist ein leistungsstarker Apache-Spark-Dienst auf Kubernetes und umfasst produktivitätssteigernde Funktionen, die bei Data-Engineering-Diensten normalerweise nicht verfügbar sind:

  • Visuelles GUI-basiertes Monitoring, Fehlerdiagnose und Leistungsoptimierung zur schnelleren Störungsbehebung und Problemlösung
  • Native Apache Airflow und robuste APIs zur Orchestrierung und Automatisierung der Auftragsplanung und Bereitstellung komplexer Datenströme an jedem beliebigen Ort
  • Ressourcenisolierung und zentralisierte GUI-basierte Auftragsverwaltung
  • CDP Data Lifecycle Integration und zentralisierte Sicherheit und Governance durch Shared Data Experience (SDX)

„Data Engineering ist enorm wichtig für die Vorbereitung auf die Datenwissenschaft, denn es ist mit der Operationalisierung verknüpft“, so Stewart Bond, Research Director bei IDC Data Integration and Intelligence Software Service. „Es ist ein weit verbreitetes Problem, dass ML-Modelle nicht in Produktion gehen. Das ist zum Teil auf die Herausforderungen zurückzuführen, die mit der Automatisierung von Data-Engineering-Strömen einhergehen, da Organisationen Schwierigkeiten haben, die Punkte zu verbinden. Eine integrierte Plattform, die alles zusammenführt, ist von großem Wert.“

Die Aufbereitung von Daten für Analyse- und Produktions-Anwendungsfälle über den gesamten Datenlebenszyklus hinweg ist entscheidend für die Umwandlung von Daten in Geschäftswert. CDP Data Engineering ist ein Service, der Datenströme schneller erfasst, anreichert und daraus neue Erkenntnisse gewinnt.

CDP Operational Database

Unternehmen werden stets große Mengen an strukturierten und unstrukturierten Daten erzeugen. Daher ist es Aufgabe der Entwickler, Anwendungen zu erarbeiten, die den Zugriff auf die Informationen demokratisieren, Aktionen in Echtzeit ermöglichen und die ein integraler Bestandteil des Geschäftsbetriebs und der Umsatzgenerierung sind. CDP Operational Database ist ein hochleistungsfähiger NoSQL-Datenbankservice, der für geschäftskritische betriebliche Anwendungen enorme Skalierbarkeit und Leistung bietet:

  • Evolutionäres Schema hilft, den Wert aus Daten nutzen zu können und gleichzeitig Flexibilität beim Anwendungsdesign zu erhalten: Änderungen an zugrunde liegenden Datenmodellen erfolgen ohne Änderungen an der Anwendung
  • Automatische Skalierung basierend auf der Auslastung des Clusters optimiert die Infrastrukturnutzung und -kosten
  • Multimodaler Client-Zugriff mit NoSQL-Schlüsselwert unter Verwendung von HBase-APIs und relationaler SQL mit JDBC. Dadurch wird die CDP Operational Database für Entwickler zugänglich, die es gewohnt sind, Anwendungen zu erstellen, die beispielsweise MySQL oder Postgres verwenden.
  • Integration des gesamten Datenlebenszyklus durch CDP und Sicherheit und Governance dank SDX

CDP Data Visualization

Datenanalysten müssen in der Lage sein, Analyseergebnisse so zu teilen und zu erklären, dass sie von den Interessengruppen des Unternehmens schnell verstanden und umgesetzt werden können. Auch Geschäftsanwender müssen in der Lage sein, Visualisierungen aus Daten und Vorhersagemodellen zu erstellen. CDP Data Visualization vereinfacht die Erstellung umfangreicher, visueller Dashboards, Berichte und Diagramme und verhilft zu einem agilen und analytischen Einblick in das Geschäft. Zudem demokratisiert der Service den Zugang zu Daten und Analysen im gesamten Unternehmen:

  • Technische Teams können Analysen und ML-Lernmodelle mit Hilfe von benutzerdefinierten interaktiven Drag & Drop-Anwendungen schnell untereinander teilen.
  • Geschäftsteams und Entscheidungsträger erhalten Dateneinblicke für vertrauenswürdige, gut informierte Entscheidungen.
  • Alle Teams profitieren von der schnellen Datenexploration mit KI-gestützter natürlicher Sprachsuche und visuellen Empfehlungen.

Verfügbarkeit und Preisgestaltung

CDP Data Engineering ist auf AWS verfügbar. Informationen zur Preisgestaltung finden Sie hier. CDP Operational Database und CDP Data Visualization befinden sich in der technischen Vorschau und werden voraussichtlich im Laufe dieses Jahres verfügbar sein.

Über Cloudera
Bei Cloudera sind wir davon überzeugt, dass Daten Unmögliches möglich machen. Daher befähigen
wir Unternehmen, komplexe Daten zu verstehen und klare Erkenntnisse und Handlungen abzuleiten.
Die Cloudera Enterprise Data Cloud verarbeitet alle Daten, unabhängig vom Ablageort – vom Edge
bis hin zu KI-Anwendungen. Angetrieben von der unermüdlichen Innovation der
Open-Source-Community, beschleunigt Cloudera die digitale Transformation für die größten
Unternehmen der Welt. Erfahren Sie mehr unter Cloudera.de.

Cloudera, Inc.
Sophia Hodgson

Be the first to comment

Leave a Reply

Your email address will not be published.