1) Ich habe einen reinen Map-Hadoop-Auftrag, der die Daten an den Cassandra-Cluster streamt.
2) Manchmal dauert das Streaming mehr als 10 Minuten, und da der Fortschritt nicht an den Auftrag gemeldet wird, wird die Aufgabe abgebrochen.
3) Ich habe versucht, den Fortschritt mit der Methode context.progress() zu melden, aber es hat nicht geholfen.
Ist noch etwas anderes erforderlich, um den Fortschritt an den Hadoop-Job zu melden?
Ich habe einen Beispielcode wie folgt geschrieben, um das Problem zu simulieren und mit dem folgenden Code.
Thread.sleep(360000);
context.progress();
Thread.sleep(360000);
Es schlägt mit folgender Fehlermeldung fehl
12/02/06 11:40:25 INFO mapred.JobClient: Task Id : attempt_201202061119_0001_m_000001_1, Status : FAILED Task attempt_201202061119_0001_m_000001_1 konnte 601 Sekunden lang keinen Status melden. Sekunden. Töten!