Weitere Lösungen sind das Zuweisen von RangeIndex
oder range
:
df.index = pd.RangeIndex(len(df.index))
df.index = range(len(df.index))
Es ist schneller:
df = pd.DataFrame({'a':[8,7], 'c':[2,4]}, index=[7,8])
df = pd.concat([df]*10000)
print (df.head())
In [298]: %timeit df1 = df.reset_index(drop=True)
Der langsamste Durchlauf dauerte 7,26 Mal länger als der schnellste. Dies könnte bedeuten, dass ein Zwischenergebnis zwischengespeichert wird.
10000 loops, best of 3: 105 µs per loop
In [299]: %timeit df.index = pd.RangeIndex(len(df.index))
Der langsamste Durchlauf dauerte 15,05 Mal länger als der schnellste. Dies könnte bedeuten, dass ein Zwischenergebnis zwischengespeichert wird.
100000 loops, best of 3: 7,84 µs pro Schleife
In [300]: %timeit df.index = range(len(df.index))
Der langsamste Durchlauf dauerte 7,10 Mal länger als der schnellste. Dies könnte bedeuten, dass ein Zwischenergebnis zwischengespeichert wird.
100000 loops, best of 3: 14,2 µs pro Schleife