结构化标记处理工具¶
Python 支持各种模块,以处理各种形式的结构化数据标记。 这包括使用标准通用标记语言(SGML)和超文本标记语言(HTML)的模块,以及使用可扩展标记语言(XML)的几个接口。
html
--- 超文本标记语言支持html.parser
--- 简单的 HTML 和 XHTML 解析器html.entities
--- HTML 一般实体的定义- XML处理模块
xml.etree.ElementTree
--- ElementTree XML APIxml.dom
--- 文档对象模型 APIxml.dom.minidom
--- 最小化的 DOM 实现xml.dom.pulldom
--- 对构建部分 DOM 树的支持xml.sax
--- SAX2 解析器支持xml.sax.handler
--- SAX 处理器的基类ContentHandler
DTDHandler
EntityResolver
ErrorHandler
LexicalHandler
feature_namespaces
feature_namespace_prefixes
feature_string_interning
feature_validation
feature_external_ges
feature_external_pes
all_features
property_lexical_handler
property_declaration_handler
property_dom_node
property_xml_string
all_properties
- ContentHandler 对象
- DTDHandler 对象
- EntityResolver 对象
- ErrorHandler 对象
- LexicalHandler 对象
xml.sax.saxutils
--- SAX 工具集xml.sax.xmlreader
--- 用于 XML 解析器的接口xml.parsers.expat
--- 使用 Expat 进行快速 XML 解析ExpatError
error
XMLParserType
ErrorString()
ParserCreate()
- XMLParser对象
Parse()
ParseFile()
SetBase()
GetBase()
GetInputContext()
ExternalEntityParserCreate()
SetParamEntityParsing()
UseForeignDTD()
SetReparseDeferralEnabled()
GetReparseDeferralEnabled()
buffer_size
buffer_text
buffer_used
ordered_attributes
specified_attributes
ErrorByteIndex
ErrorCode
ErrorColumnNumber
ErrorLineNumber
CurrentByteIndex
CurrentColumnNumber
CurrentLineNumber
XmlDeclHandler()
StartDoctypeDeclHandler()
EndDoctypeDeclHandler()
ElementDeclHandler()
AttlistDeclHandler()
StartElementHandler()
EndElementHandler()
ProcessingInstructionHandler()
CharacterDataHandler()
UnparsedEntityDeclHandler()
EntityDeclHandler()
NotationDeclHandler()
StartNamespaceDeclHandler()
EndNamespaceDeclHandler()
CommentHandler()
StartCdataSectionHandler()
EndCdataSectionHandler()
DefaultHandler()
DefaultHandlerExpand()
NotStandaloneHandler()
ExternalEntityRefHandler()
- ExpatError 异常
- 示例
- 内容模型描述
- Expat 错误常量
codes
messages
XML_ERROR_ASYNC_ENTITY
XML_ERROR_ATTRIBUTE_EXTERNAL_ENTITY_REF
XML_ERROR_BAD_CHAR_REF
XML_ERROR_BINARY_ENTITY_REF
XML_ERROR_DUPLICATE_ATTRIBUTE
XML_ERROR_INCORRECT_ENCODING
XML_ERROR_INVALID_TOKEN
XML_ERROR_JUNK_AFTER_DOC_ELEMENT
XML_ERROR_MISPLACED_XML_PI
XML_ERROR_NO_ELEMENTS
XML_ERROR_NO_MEMORY
XML_ERROR_PARAM_ENTITY_REF
XML_ERROR_PARTIAL_CHAR
XML_ERROR_RECURSIVE_ENTITY_REF
XML_ERROR_SYNTAX
XML_ERROR_TAG_MISMATCH
XML_ERROR_UNCLOSED_TOKEN
XML_ERROR_UNDEFINED_ENTITY
XML_ERROR_UNKNOWN_ENCODING
XML_ERROR_UNCLOSED_CDATA_SECTION
XML_ERROR_EXTERNAL_ENTITY_HANDLING
XML_ERROR_NOT_STANDALONE
XML_ERROR_UNEXPECTED_STATE
XML_ERROR_ENTITY_DECLARED_IN_PE
XML_ERROR_FEATURE_REQUIRES_XML_DTD
XML_ERROR_CANT_CHANGE_FEATURE_ONCE_PARSING
XML_ERROR_UNBOUND_PREFIX
XML_ERROR_UNDECLARING_PREFIX
XML_ERROR_INCOMPLETE_PE
XML_ERROR_XML_DECL
XML_ERROR_TEXT_DECL
XML_ERROR_PUBLICID
XML_ERROR_SUSPENDED
XML_ERROR_NOT_SUSPENDED
XML_ERROR_ABORTED
XML_ERROR_FINISHED
XML_ERROR_SUSPEND_PE
XML_ERROR_RESERVED_PREFIX_XML
XML_ERROR_RESERVED_PREFIX_XMLNS
XML_ERROR_RESERVED_NAMESPACE_URI
XML_ERROR_INVALID_ARGUMENT
XML_ERROR_NO_BUFFER
XML_ERROR_AMPLIFICATION_LIMIT_BREACH