14 Stimmen

ETL mit Python

Ich arbeite an einem Data-Warehouse und suche nach einer ETL-Lösung, die Python verwendet. Ich habe mit SnapLogic als ETL gearbeitet, aber ich frage mich, ob es noch andere Lösungen gibt.

Dieses Data-Warehouse steht erst am Anfang. Ich habe noch keine Daten übertragen. Es wird mit dem anfänglichen Datensubset, das ich laden möchte, leicht über 100 Gigabyte sein.

24voto

S.Lott Punkte 371691

Ja. Schreiben Sie einfach Python mit einer DB-API-Schnittstelle zu Ihrer Datenbank.

Die meisten ETL-Programme bieten schicke "Hochsprachen" oder Drag-and-Drop-GUIs, die nicht viel helfen.

Python ist genauso ausdrucksstark und genauso einfach zu handhaben.

Meiden Sie Verschleierung. Verwenden Sie einfach das gute alte Python.

Wir machen das jeden Tag und sind mit den Ergebnissen sehr zufrieden. Es ist einfach, klar und effektiv.

1voto

Umar Aftab Punkte 489

Sie können pyodbc verwenden, eine von Python bereitgestellte Bibliothek, um Daten aus verschiedenen Datenquellen abzurufen. Verwenden Sie dann pandas-Datenrahmen, um die Daten entsprechend den organisatorischen Anforderungen zu manipulieren und zu bereinigen. Verwenden Sie anschließend pyodbc, um sie in Ihr Data Warehouse zu laden.

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X