Ich habe auf der Heritrix-Dokumentations-Website nachgesehen, und dort ist ein Python-ARC-Dateireader aufgeführt. Allerdings ist es 404 nicht gefunden, wenn ich darauf geklickt. http://crawler.archive.org/articles/developer_manual/arcs.html
Kennt noch jemand einen Heritrix ARC-Reader, der Python verwendet?
(Ich habe diese Frage schon einmal gestellt, sie aber wegen Ungenauigkeit geschlossen)