Tolle Informationen hier? Ich habe Pentaho noch nicht ausprobiert, aber ich habe vor, es zu testen. Ich bin ein erfahrener MS BI-Berater und benutze es seit 1998. SSIS ist sehr schnell und sehr leistungsfähig, aber die Kritikpunkte sind genau richtig. Ich habe die folgenden Probleme mit SSIS gefunden:
(1) Es ist schwer zu debuggen, Sie erhalten kryptische Fehler, die Ihnen keinen Hinweis darauf geben, was und wo das Problem wirklich liegt.
(2) Wie in einem früheren Kommentar erwähnt, ist es die beschissenste Entwicklungsumgebung überhaupt! Ich habe keine Ahnung, was sie sich dabei gedacht haben.
(a) Erstellen Sie eine Tabelle mit 100 oder mehr Spalten und legen Sie einen Merge Join an. Gehen Sie nun wieder hinein und versuchen Sie, die Verknüpfung zu aktualisieren (z. B. eine neue Spalte einzufügen). Selbst auf dem schnellsten Rechner kann es mehrere Minuten dauern, nachdem Sie auf "OK" geklickt haben, um Ihre Änderung zu speichern. Ich habe einen riesigen Datenfluss mit vielen breiten Datensätzen und vielen Zusammenführungen (Merge Joins). Das Hinzufügen einer Spalte zum Datenfluss dauert mehr als einen halben Tag. Ich aktualisiere eine Verknüpfung und muss dann etwas anderes tun und 5-10 Minuten später wieder nachsehen, ob es erledigt ist. Microsofts Antwort darauf ist, das Paket in mehrere Pakete aufzuteilen und die Daten in einer Tabelle oder einer Binärdatei zwischen den Paketen zu speichern. Nun, wenn Sie zwischen all diesen Schritten eine Diskette einlegen, können Sie das Ganze auch in SQL machen! Einer der Hauptzwecke eines ETL-Tools besteht darin, all diese Daten im Speicher zu halten und E/A auf der Festplatte zu vermeiden.
(b) Der Designer stürzt manchmal regelrecht ab, wobei die gesamte Arbeit seit dem letzten Speichern verloren geht (ich benutze Strg-S jetzt im Schlaf, weil das so ist)
(c) Ich musste mir einen Hack ausdenken und SSIS-Paket-XML in Excel für breite Datensätze generieren. Ich habe einen Kunden im Gesundheitswesen, bei dem Datensätze mit mehr als 600 Spalten an der Tagesordnung sind. Wenn Sie versuchen, ein Dateiformat mit 600 Spalten in SSIS zu definieren, müssen Sie jede einzelne Spalte einzeln eingeben!!! Selbst in MS Access kann man ein Layout aus einer Tabellenkalkulation ausschneiden und in ein Dateilayout einfügen, aber nicht in SSIS. Also musste ich das XML aus dem Layout generieren und den XML-Code an der richtigen Stelle in das Paket einfügen. Eine hässliche Methode, aber sie hat mir ganze Tage Arbeit und viele Fehler erspart.
(d) Ähnlich wie bei (c), wenn Sie alle Ihre Spalten kürzen müssen und Sie mehr als 600 davon haben, raten Sie mal? In der abgeleiteten Spaltenkomponente müssen Sie trim(column1) 600+ mal eingeben! Ich führe jetzt alle einfachen Transformationen wie diese in der SQL-Abfrage durch, um die Daten zu erhalten, da diese leicht aus einer Excel-Tabelle generiert werden können.
(e) Es gibt viele merkwürdige Dinge, Komponenten, die unsichtbar werden, manchmal öffnet man das Paket und alle Komponenten sind völlig unzusammenhängend neu angeordnet.
(f) Die FTP-Funktion, wahrscheinlich eine der am häufigsten benötigten Funktionen in ETL, ist schwach und unterstützt nur einfaches Vanilla-FTP, das niemand verwendet. Jeder verwendet heutzutage SFTP, FTPS, https, etc... Daher erfordert fast jede Implementierung die Verwendung einer Kommandozeilen-gesteuerten Dateiübertragungsanwendung eines Drittanbieters, die das Paket aufrufen muss.
(g) Ähnlich wie bei den lächerlichen Sicherheitsvorkehrungen in Windows Vista hat es Microsoft aus Gründen der ZYA äußerst schwierig gemacht, ein SSIS-Paket von einer Umgebung in eine andere zu übertragen. Das bedeutet, dass es in der Umgebung, in die Sie es verschieben, unter demselben Konto laufen muss wie in der Umgebung, in der Sie es entwickelt haben, was selten der Fall ist. Es gibt bessere Möglichkeiten der Konfiguration, aber es wird immer versucht, auf diesen völlig nutzlosen Sicherheitsschutz zurückzugreifen.
(h) Schließlich sind die meisten dieser Probleme bereits in der dritten Version vorhanden, was eindeutig darauf hindeutet, dass Microsoft nicht vorhat, sie zu beheben.
(i) Die Fehlersuche ist nicht annähernd so einfach wie bei anderen Sprachen.
SSIS hat immer noch viele Vorteile, aber nicht ohne einige ernsthafte Schmerzen.