Unter Verwendung des Beispiels von @jerry_sjtu:
+------------+---------+--------+
| | A | B |
+------------+---------
| 0 | 0.626386| 1.52325|
+------------+---------+--------+
Die Pandas-Dokumentation löst wahrscheinlich die Hälfte des Problems wie folgt (es führt den Mittelwert der Zeilen für jede Spalte aus):
Achse{0 oder 'index', 1 oder 'columns'}, standardmäßig 0
Achse, auf der die Funktion angewendet wird:
0 oder 'index': wenden Sie die Funktion auf jede Spalte an.
1 oder 'columns': wenden Sie die Funktion auf jede Zeile an.
dff.mean(axis='index')
ergibt die erwartete Antwort (es führt den Mittelwert der Werte entlang der Zeile aus - es gibt nur eine Zeile, daher entspricht der Mittelwert den Zeilenwerten). Bemerkenswerterweise gibt Pandas auch das Spaltenlabel an und reduziert damit die Mehrdeutigkeit:
A 0.626386
B 1.523255
dtype: float64
Andererseits ergibt dff.mean(axis='column')
(es führt den Mittelwert der Werte entlang der Spalten aus - es gibt zwei Spalten, daher wird der Mittelwert berechnet: 0.62.. + 1.75.. = /2 => 1.07..). Bemerkenswerterweise gibt Pandas auch das Indexlabel, also "0", an und reduziert damit die Mehrdeutigkeit:
0 1.074821
dtype: float64
Fazit: Vielleicht würde es weniger verwirrend sein, wenn man statt '1' 'column', 'column' verwendet - und es formuliert als ...Werte entlang des angegebenen Labels, z.B. Spalten! Ein anderer Ansatz ist das Konsultieren der Handbuchseiten. Man kann die Operation validieren, indem man die Ergebnisse überprüft, bei denen Spalten- oder Indexnamen vorhanden sind.
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.apply.html