Ich habe einen DataFrame df
und ich verwende mehrere Spalten daraus, um mit groupby
zu gruppieren:
df['col1','col2','col3','col4'].groupby(['col1','col2']).mean()
Auf diese Weise erhalte ich fast die Tabelle (DataFrame), die ich brauche. Was fehlt, ist eine zusätzliche Spalte, die die Anzahl der Zeilen in jeder Gruppe enthält. Mit anderen Worten, ich habe den Mittelwert, aber ich möchte auch wissen, wie viele verwendet wurden, um diese Mittelwerte zu erhalten. Zum Beispiel gibt es in der ersten Gruppe 8 Werte und in der zweiten 10 usw.
Kurz gesagt: Wie erhalte ich gruppenweise Statistiken für einen DataFrame?