13 Stimmen

html zu .doc Konverter in Python?

Ich verwende pisa, eine Bibliothek zur Umwandlung von HTML in PDF für Python.

Gibt es dasselbe für ein Word-Dokument: eine HTML-zu.doc-Konvertierungsbibliothek für Python?

12voto

Steven Punkte 26455

Sie könnten win32com aus dem pywin32 Python-Erweiterungen für Windows, damit MS Word sie für Sie konvertieren kann. Ein einfaches Beispiel:

import win32com.client

word = win32com.client.Dispatch('Word.Application')

doc = word.Documents.Add('example.html')
doc.SaveAs('example.doc', FileFormat=0)
doc.Close()

word.Quit()

5voto

user225312 Punkte 117771

Allerdings ist mir kein direktes Modul bekannt, mit dem Sie dies umwandeln können:

  1. Sie können konvertieren HTML a einfacher Text zunächst über die html2text Modul.
  2. Danach können Sie die python-docx Modul zur Umwandlung des Textes in eine doc または docx Datei.

2voto

Cooldox Punkte 21

Falls noch jemand hier landet und versucht, andersherum zu konvertieren, funktioniert der obige Code, aber Sie müssen den Wert FileFormat ändern.

http://msdn.microsoft.com/en-us/library/ff839952.aspx

Beispiel: Gefilterte html ist 10, statt 0.

-1voto

Synthase Punkte 4890

Ein Update mit python3.x behebt dies:

from htmldocx import HtmlToDocx

new_parser = HtmlToDocx()
new_parser.parse_html_file("html_filename", "docx_filename")
#Files extensions not needed, but tolerated

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X