19. Outils de traitement de balises structurées¶
Python intègre une variété de modules pour fonctionner avec différentes formes de données structurées et balisées, comme le SGML (Standard Generalized Markup Language), le HTML (Hypert Markup Language), et quelques interfaces pour travailler avec du XML (eXtensible Markup Language).
It is important to note that modules in the xml
package require that
there be at least one SAX-compliant XML parser available. Starting with Python
2.3, the Expat parser is included with Python, so the xml.parsers.expat
module will always be available. You may still want to be aware of the PyXML
add-on package; that package provides an
extended set of XML libraries for Python.
La documentation des bindings des interfaces DOM et SAX se trouve dans xml.dom
et xml.sax
.
- 19.1.
HTMLParser
— Simple HTML and XHTML parser - 19.2.
sgmllib
— Simple SGML parser - 19.3.
htmllib
— A parser for HTML documents - 19.4.
htmlentitydefs
— Definitions of HTML general entities - 19.5. Modules de traitement XML
- 19.6. Vulnérabilités XML
- 19.7.
xml.etree.ElementTree
— The ElementTree XML API - 19.8.
xml.dom
— L’API Document Object Model- 19.8.1. Contenu du module
- 19.8.2. Objets dans le DOM
- 19.8.2.1. Objets DOMImplementation
- 19.8.2.2. Objets nœuds
- 19.8.2.3. Objet NodeList
- 19.8.2.4. Objets DocumnentType
- 19.8.2.5. Objets Document
- 19.8.2.6. Objets Elements
- 19.8.2.7. Objets Attr
- 19.8.2.8. Objets NameNodeMap
- 19.8.2.9. Objets Comment
- 19.8.2.10. Objets Text et CDATASection
- 19.8.2.11. Objets ProcessingInstruction
- 19.8.2.12. Exceptions
- 19.8.3. Conformité
- 19.9.
xml.dom.minidom
— Minimal DOM implementation - 19.10.
xml.dom.pulldom
— Support for building partial DOM trees - 19.11.
xml.sax
— Prise en charge des analyseurs SAX2 - 19.12.
xml.sax.handler
— Base classes for SAX handlers - 19.13.
xml.sax.saxutils
— Utilitaires SAX - 19.14.
xml.sax.xmlreader
— Interface for XML parsers - 19.15.
xml.parsers.expat
— Fast XML parsing using Expat