Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
python:python_www [2017/11/29 22:53] Francesco Beretta |
python:python_www [2019/11/16 12:55] Francesco Beretta [Récupérer des pages HTML et les transformer en XML] |
||
---|---|---|---|
Ligne 9: | Ligne 9: | ||
+ | ==== Récupérer des pages HTML et les transformer en XML ==== | ||
+ | |||
+ | * LXML | ||
+ | * [[http://adrien.barbaresi.eu/blog/parsing-converting-lxml-html-tei.html|Parsing and converting HTML documents to XML/TEI format using Python’s lxml]] |