Warum sollten Sie die Lösungen kombinieren? Hadoop hat einige großartige Fähigkeiten (siehe URL unten). Diese Fähigkeiten umfassen jedoch nicht die Möglichkeit, dass Geschäftsanwender schnelle Analysen durchführen können. Abfragen, die in Hadoop 30 Minuten bis Stunden dauern, werden mit Infobright in 10 Sekunden ausgeführt.
Ihre ursprüngliche Frage ging übrigens nicht von einer MPP-Architektur aus, und das aus gutem Grund. Die Infobright-Kunden Liverail, AdSafe Media & InMobi, unter anderem, nutzen IEE mit Hadoop.
Wenn Sie sich für ein Industry White Paper registrieren http://support.infobright.com/Support/Resource-Library/Whitepapers/ sehen Sie einen Überblick über den aktuellen Markt, in dem vier vorgeschlagene Anwendungsfälle für Hadoop skizziert werden. Er wurde von Wayne Eckerson , Director of Research, Business Applications and Architecture Group, TechTarget, im September 2011 verfasst.
1) Erstellen Sie ein Online-Archiv .
Mit Hadoop müssen Unternehmen die Daten nicht löschen oder auf einen Offline-Speicher verlagern, sondern können sie auf unbestimmte Zeit online halten, indem sie Standard-Server hinzufügen, um die Speicher- und Verarbeitungsanforderungen zu erfüllen. Hadoop wird so zu einer kostengünstigen Alternative für die Erfüllung von Online-Archivierungsanforderungen.
2) Füttern des Data Warehouse .
Unternehmen können Hadoop auch zum Parsen, Integrieren und Aggregieren großer Mengen von Web- oder anderen Datentypen verwenden und diese dann an das Data Warehouse weiterleiten, wo sowohl Gelegenheits- als auch Power-User die Daten mit bekannten BI-Tools abfragen und analysieren können. In diesem Fall wird Hadoop zu einem ETL-Tool für die Verarbeitung großer Mengen von Webdaten, bevor sie im Data Warehouse des Unternehmens landen.
3) Unterstützung der Analytik.
Die Big-Data-Gemeinde (d. h. die Internet-Entwickler) betrachtet Hadoop in erster Linie als Analyse-Engine für die Durchführung analytischer Berechnungen mit großen Datenmengen. Um Hadoop abzufragen, müssen Analysten derzeit Programme in Java oder anderen Sprachen schreiben und MapReduce verstehen, ein Framework zum Schreiben verteilter (oder paralleler) Anwendungen. Der Vorteil dabei ist, dass Analysten bei der Formulierung von Abfragen nicht durch SQL eingeschränkt sind. SQL unterstützt viele Arten von Analysen nicht, insbesondere solche, die Berechnungen zwischen den Zeilen beinhalten, wie sie bei der Analyse des Webverkehrs üblich sind. Der Nachteil ist, dass Hadoop Batch-orientiert ist und sich nicht für iterative Abfragen eignet.
4) Berichte ausführen.
Durch seine Batch-Orientierung eignet sich Hadoop jedoch für die Ausführung von regelmäßig geplanten Berichten. Anstatt Berichte anhand von zusammengefassten Daten auszuführen, können Unternehmen sie jetzt anhand von Rohdaten ausführen, was die genauesten Ergebnisse garantiert.