python:python_www
Ceci est une ancienne révision du document !
Revenir à l'accueil
Technologies HTML et complémentaires
Récupérer des pages HTML et les transformer en XML
LXML
BeautifulSoup
Trafilatura
Une nouvelle librairie en cours de développement, utile et clés en main, parfois un peu limitée dans les possitilités de choix (en fonction de la compléxité de la page
HTML)
-
-
-
python/python_www.1573997488.txt.gz · Dernière modification: 2019/11/17 14:31 par Francesco Beretta