Wie kann ich die Eingabeprotokolle .PCAP(Binary) mit Map Rreduce Hadoop verwenden?

Question

Wie kann ich die Eingabeprotokolle .PCAP(Binary) mit Map Rreduce Hadoop verwenden?

Gefragt el 7 de August, 2009: Wann wurde die Frage gestellt
1567 Ansichten: Anzahl der Besuche der Frage
3 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Logs Tcpdumps sind Binärdateien, ich möchte wissen, welches FileInputFormat von Hadoop ich für die Aufteilung der Eingabedaten in Chunks verwenden sollte...bitte helfen Sie mir!!!

Gefragt el 7 de August, 2009 von Nicht registrierter Benutzer

1 Stimmen

Hmm, der Benutzername ist Stalyn und möchte wissen, wie man riesige pcap (packet capture) dumps verarbeitet

Kommentiert el 9 de August, 2009 von Adam Batkin

Answer 1

3 Antworten

Answer 2

2voto

SquareCog Punkte 19031

Es gab einen Thread in der Benutzerliste zu diesem Thema: http://hadoop.markmail.org/search/list:org%2Eapache%2Ehadoop%2Ecore-user+pcap+bestellung:datum-weiter

Im Grunde ist das Format nicht aufteilbar, da man den Anfang eines Datensatzes, der an einem beliebigen Offset in der Datei beginnt, nicht finden kann. Sie müssen also eine Vorverarbeitung vornehmen, indem Sie Synchronisationspunkte oder ähnliches einfügen. Vielleicht kleinere Dateien in Sequenzdateien umwandeln und dann die kleinen Sequenzdateien zusammenführen?

Wenn Sie etwas Wiederverwendbares schreiben, denken Sie bitte daran, einen Beitrag zum Projekt zu leisten.

Beantwortet el 9 de August, 2009 von SquareCog (19031 Punkte )

Answer 3

1voto

jonathan-stafford Punkte 11347

Schreiben Sie ein InputFormat, das PCAP-Dateien liest und etwas wie LongWritable als Schlüssel (das n-te Paket in der Datei) und PacketWritable als Wert (mit den PCAP-Daten) zurückgibt. Für den InputSplit können Sie FileSplit oder MultiFileSplit für eine bessere Leistung verwenden, da eine einzelne PCAP-Datei überraschend schnell gelesen werden kann.

Wenn Ihre Blockgröße nicht größer ist als die Größe Ihrer pcap-Dateien, werden Sie eine Menge Netzwerk-IO erleben...

Beantwortet el 1 de Oktober, 2009 von jonathan-stafford (11347 Punkte )

Answer 4

1voto

Wolfgang Nagele Punkte 11

Wir haben kürzlich eine Bibliothek für Dateien im PCAP-Format veröffentlicht: https://github.com/RIPE-NCC/hadoop-pcap

Beantwortet el 3 de Dezember, 2011 von Wolfgang Nagele (11 Punkte )

Wie kann ich die Eingabeprotokolle .PCAP(Binary) mit Map Rreduce Hadoop verwenden?

Antworten

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Wie kann ich die Eingabeprotokolle .PCAP(Binary) mit Map Rreduce Hadoop verwenden?

Antworten

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: