Parsen von rohen HTTP-Headern

Question

Parsen von rohen HTTP-Headern

Gefragt el 13 de Januar, 2011: Wann wurde die Frage gestellt
80453 Ansichten: Anzahl der Besuche der Frage
4 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Ich habe einen String mit rohem HTTP und möchte die Felder in einem Objekt darstellen. Gibt es eine Möglichkeit, die einzelnen Header aus einem HTTP-String zu analysieren?

'GET /search?sourceid=chrome&ie=UTF-8&q=ergterst HTTP/1.1\r\nHost: www.google.com\r\nConnection: keep-alive\r\nAccept: application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5\r\nUser-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_6; en-US) AppleWebKit/534.13 (KHTML, like Gecko) Chrome/9.0.597.45 Safari/534.13\r\nAccept-Encoding: gzip,deflate,sdch\r\nAvail-Dictionary: GeNLY2f-\r\nAccept-Language: en-US,en;q=0.8\r\n
[...]'

Gefragt el 13 de Januar, 2011 von Cev

Answer 1

4 Antworten

Answer 2

1voto

Wellington Rats Punkte 84

Auf eine pythonische Weise

request_text = (
    b'GET /who/ken/trust.html HTTP/1.1\r\n'
    b'Host: cm.bell-labs.com\r\n'
    b'Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.3\r\n'
    b'Accept: text/html;q=0.9,text/plain\r\n'
    b'\r\n'
)

print({ k:v.strip() for k,v in [line.split(":",1) 
        for line in request_text.decode().splitlines() if ":" in line]})

Beantwortet el 23 de Marsch, 2020 von Wellington Rats (84 Punkte )

Answer 3

0voto

Misha Shaygu Punkte 51

In Python3

from email import message_from_string    
data = socket.recv(4096)
headers = message_from_string(str(data, 'ASCII').split('\r\n', 1)[1])
print(headers['Host'])

Beantwortet el 28 de Juni, 2019 von Misha Shaygu (51 Punkte )

Answer 4

0voto

Ousret Punkte 126

Es gibt einen anderen, einfacheren und sichereren Weg, Kopfzeilen zu behandeln. Mehr objektorientiert. Keine Notwendigkeit für manuelles Parsing.

Kurzes Demo.

1. Analysieren Sie sie

Von str , bytes , fp , dict , requests.Response , email.Message , httpx.Response , urllib3.HTTPResponse .

from requests import get
from kiss_headers import parse_it

response = get('https://www.google.fr')
headers = parse_it(response)

headers.content_type.charset  # output: ISO-8859-1
# Its the same as
headers["content-type"]["charset"]  # output: ISO-8859-1

2. Bauen Sie sie

Ce site

from kiss_headers import *

headers = (
    Host("developer.mozilla.org")
    + UserAgent(
        "Mozilla/5.0 (Macintosh; Intel Mac OS X 10.9; rv:50.0) Gecko/20100101 Firefox/50.0"
    )
    + Accept("text/html")
    + Accept("application/xhtml+xml")
    + Accept("application/xml", qualifier=0.9)
    + Accept(qualifier=0.8)
    + AcceptLanguage("en-US")
    + AcceptLanguage("en", qualifier=0.5)
    + AcceptEncoding("gzip")
    + AcceptEncoding("deflate")
    + AcceptEncoding("br")
    + Referer("https://developer.mozilla.org/testpage.html")
    + Connection(should_keep_alive=True)
    + UpgradeInsecureRequests()
    + IfModifiedSince("Mon, 18 Jul 2016 02:36:04 GMT")
    + IfNoneMatch("c561c68d0ba92bbeb8b0fff2a9199f722e3a621a")
    + CacheControl(max_age=0)
)

raw_headers = str(headers)

Wird werden

Host: developer.mozilla.org
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10.9; rv:50.0) Gecko/20100101 Firefox/50.0
Accept: text/html, application/xhtml+xml, application/xml; q="0.9", */*; q="0.8"
Accept-Language: en-US, en; q="0.5"
Accept-Encoding: gzip, deflate, br
Referer: https://developer.mozilla.org/testpage.html
Connection: keep-alive
Upgrade-Insecure-Requests: 1
If-Modified-Since: Mon, 18 Jul 2016 02:36:04 GMT
If-None-Match: "c561c68d0ba92bbeb8b0fff2a9199f722e3a621a"
Cache-Control: max-age="0"

Dokumentation für die kiss-headers-Bibliothek .

Beantwortet el 13 de April, 2020 von Ousret (126 Punkte )

Answer 5

0voto

buherator Punkte 111

Zu dieser Frage: Wie man rohe HTTP-Anfrage in Python 3 parsen?

Hier sind einige Python-Pakete, die auf die korrekte Analyse des HTTP-Protokolls abzielen:

https://dpkt.readthedocs.io/en/latest/api/api_auto.html#module-dpkt.http
https://h11.readthedocs.io/en/latest/
https://github.com/benoitc/http-parser/ (C-Backend)
https://github.com/MagicStack/httptools (basierend auf dem C-Backend von NodeJS)
https://github.com/silentsignal/netlib-offline (schamlose Werbung)

Beantwortet el 2 de Juni, 2022 von buherator (111 Punkte )

Parsen von rohen HTTP-Headern

Antworten

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Parsen von rohen HTTP-Headern

Antworten

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: