Ich verwende Pandas als Ersatz für eine Datenbank, da ich mehrere Datenbanken (Oracle, SQL Server, etc.) habe und nicht in der Lage bin, eine Abfolge von Befehlen zu einem SQL-Äquivalent zu machen.
Ich habe eine Tabelle in einem DataFrame geladen mit einigen Spalten:
YEARMONTH, CLIENTCODE, SIZE, etc., etc.
In SQL würde es so aussehen, um die Anzahl der verschiedenen Kunden pro Jahr zu zählen:
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
Und das Ergebnis wäre
201301 5000
201302 13245
Wie kann ich das in Pandas machen?