"xml.parsers.expat" ---  使用 Expat 的快速 XML 解析
***************************************************

======================================================================

警告:

  "pyexpat" 模块对于恶意构建的数据是不安全的。 如果你需要解析不受信任
  或未经身份验证的数据，请参阅 XML 漏洞。

"xml.parsers.expat" 模块是针对 Expat 非验证 XML 解析器的 Python 接口。
此模块提供了一个扩展类型 "xmlparser"，它代表一个 XML 解析器的当前状态
。 在创建一个 "xmlparser" 对象之后，该对象的各个属性可被设置为相应的处
理句柄函数。 随后当将一个 XML 文档送入解析器时，就会为该 XML 文档中的
字符数据和标记调用处理句柄函数。

此模块使用 "pyexpat" 模块来提供对 Expat 解析器的访问。 直接使用
"pyexpat" 模块的方式已被弃用。

此模块提供了一个异常和一个类型对象:

exception xml.parsers.expat.ExpatError

   此异常会在 Expat 报错时被引发。 请参阅 ExpatError 异常 一节了解有关
   解读 Expat 错误的更多信息。

exception xml.parsers.expat.error

   "ExpatError" 的别名。

xml.parsers.expat.XMLParserType

   来自 "ParserCreate()" 函数的返回值的类型。

"xml.parsers.expat" 模块包含两个函数:

xml.parsers.expat.ErrorString(errno)

   返回给定错误号 *errno* 的解释性字符串。

xml.parsers.expat.ParserCreate(encoding=None, namespace_separator=None)

   创建并返回一个新的 "xmlparser" 对象。 如果指定了 *encoding*，它必须
   为指定 XML 数据所使用的编码格式名称的字符串。 Expat 支持的编码格式
   没有 Python 那样多，而且它的编码格式库也不能被扩展；它支持 UTF-8,
   UTF-16, ISO-8859-1 (Latin1) 和 ASCII。 如果给出了 *encoding* [1] 则
   它将覆盖隐式或显式指定的文档编码格式。

   可以选择让 Expat 为你做 XML 命名空间处理，这是通过提供
   *namespace_separator* 值来启用的。 该值必须是一个单字符的字符串；如
   果字符串的长度不合法则将引发 "ValueError" ("None" 被视为等同于省略)
   。 当命名空间处理被启用时，属于特定命名空间的元素类型名称和属性名称
   将被展开。 传递给The element name passed to the 元素处理句柄
   "StartElementHandler" 和 "EndElementHandler" 的元素名称将为命名空间
   URI，命名空间分隔符和名称的本地部分的拼接。 如果命名空间分隔符是一
   个零字节 ("chr(0)") 则命名空间 URI 和本地部分将被直接拼接而不带任何
   分隔符。

   举例来说，如果 *namespace_separator* 被设为空格符 ("' '") 并对以下
   文档进行解析:

      <?xml version="1.0"?>
      <root xmlns    = "http://default-namespace.org/"
            xmlns:py = "http://www.python.org/ns/">
        <py:elem1 />
        <elem2 xmlns="" />
      </root>

   "StartElementHandler" 将为每个元素获取以下字符串:

      http://default-namespace.org/ root
      http://www.python.org/ns/ elem1
      elem2

   由于 "pyexpat" 所使用的 "Expat" 库的限制，被返回的 "xmlparser" 实例
   只能被用来解析单个 XML 文档。 请为每个文档调用 "ParserCreate" 来提
   供单独的解析器实例。

参见:

  The Expat XML Parser
     Expat 项目的主页。


XMLParser对象
=============

"xmlparser" 对象具有以下方法:

xmlparser.Parse(data[, isfinal])

   解析字符串 *data* 的内容，调用适当的处理函数来处理解析后的数据。 在
   对此方法的最后一次调用时 *isfinal* 必须为真值；它允许以片段形式解析
   单个文件，而不是提交多个文件。 *data* 在任何时候都可以为空字符串。

xmlparser.ParseFile(file)

   解析从对象 *file* 读取的 XML 数据。 *file* 仅需提供 "read(nbytes)"
   方法，当没有更多数据可读时将返回空字符串。

xmlparser.SetBase(base)

   设置要用于解析声明中的系统标识符的相对 URI 的基准。 解析相对标识符
   的任务会留给应用程序进行：这个值将作为 *base* 参数传递给
   "ExternalEntityRefHandler()", "NotationDeclHandler()" 和
   "UnparsedEntityDeclHandler()" 函数。

xmlparser.GetBase()

   返回包含之前调用 "SetBase()" 所设置的基准位置的字符串，或者如果未调
   用 "SetBase()" 则返回 "None"。

xmlparser.GetInputContext()

   将生成当前事件的输入数据以字符串形式返回。 数据为包含文本的实体的编
   码格式。 如果被调用时未激活事件处理句柄，则返回值将为 "None"。

xmlparser.ExternalEntityParserCreate(context[, encoding])

   创建一个“子”解析器，可被用来解析由父解析器解析的内容所引用的外部解
   析实体。 *context* 形参应当是传递给 "ExternalEntityRefHandler()" 处
   理函数的字符串，具体如下所述。 子解析器创建时 "ordered_attributes"
   和 "specified_attributes" 会被设为此解析器的值。

xmlparser.SetParamEntityParsing(flag)

   控制参数实体（包括外部 DTD 子集）的解析。 可能的 *flag* 值有
   "XML_PARAM_ENTITY_PARSING_NEVER",
   "XML_PARAM_ENTITY_PARSING_UNLESS_STANDALONE" 和
   "XML_PARAM_ENTITY_PARSING_ALWAYS"。 如果该旗标设置成功则返回真值。

xmlparser.UseForeignDTD([flag])

   调用时将 *flag* 设为真值（默认）将导致 Expat 调用
   "ExternalEntityRefHandler" 时将所有参数设为 "None" 以允许加载替代的
   DTD。 如果文档不包含文档类型声明，"ExternalEntityRefHandler" 仍然会
   被调用，但 "StartDoctypeDeclHandler" 和 "EndDoctypeDeclHandler" 将
   不会被调用。

   为 *flag* 传入假值将将撤消之前传入真值的调用，除此之外没有其他影响
   。

   此方法只能在调用 "Parse()" 或 "ParseFile()" 方法之前被调用；在已调
   用过这两个方法之后调用它会导致引发 "ExpatError" 且 "code" 属性被设
   为
   "errors.codes[errors.XML_ERROR_CANT_CHANGE_FEATURE_ONCE_PARSING]"。

"xmlparser" 对象具有下列属性:

xmlparser.buffer_size

   当 "buffer_text" 为真值时所使用的缓冲区大小。 可以通过将此属性赋一
   个新的整数值来设置一个新的缓冲区大小。 当大小发生改变时，缓冲区将被
   刷新。

xmlparser.buffer_text

   将此属性设为真值会使得 "xmlparser" 对象缓冲 Expat 所返回的文本内容
   以尽可能地避免多次调用 "CharacterDataHandler()" 回调。 这可以显著地
   提升性能，因为 Expat 通常会将字符数据在每个行结束的位置上进行分块。
   此属性默认为假值，但可以在任何时候被更改。

xmlparser.buffer_used

   当 "buffer_text" 被启用时，缓冲区中存储的字节数。 这些字节数据表示
   以 UTF-8 编码的文本。  当 "buffer_text" 为假值时此属性没有任何实际
   意义。

xmlparser.ordered_attributes

   将该属性设为非零整数会使得各个属性被报告为列表而非字典。 各个属性会
   按照在文档文本中的出现顺序显示。 对于每个属性，将显示两个列表条目：
   属性名和属性值。 （该模块的较旧版本也使用了此格式。） 默认情况下，
   该属性为假值；它可以在任何时候被更改。

xmlparser.specified_attributes

   如果设为非零整数，解析器将只报告在文档实例中指明的属性而不报告来自
   属性声明的属性。 设置此属性的应用程序需要特别小心地使用从声明中获得
   的附加信息以符合 XML 处理程序的行为标准。 默认情况下，该属性为假值
   ；它可以在任何时候被更改。

下列属性包含与 "xmlparser" 对象遇到的最近发生的错误有关联的值，并且一
旦对 "Parse()" 或 "ParseFile()" 的调用引发了
"xml.parsers.expat.ExpatError" 异常就将只包含正确的值。

xmlparser.ErrorByteIndex

   错误发生位置的字节索引号。

xmlparser.ErrorCode

   指明问题的的数字代码。 该值可被传给 "ErrorString()" 函数，或是与在
   "errors" 对象中定义的常量之一进行比较。

xmlparser.ErrorColumnNumber

   错误发生位置的列号。

xmlparser.ErrorLineNumber

   错误发生位置的行号。

下列属性包含 "xmlparser" 对象中关联到当前解析位置的值。 在回调报告解析
事件期间它们将指示生成事件的字符序列的第一个字符的位置。 当在回调的外
部被调用时，所指示的位置将恰好位于最后的解析事件之后（无论是否存在关联
的回调）。

xmlparser.CurrentByteIndex

   解析器输入的当前字节索引号。

xmlparser.CurrentColumnNumber

   解析器输入的当前列号。

xmlparser.CurrentLineNumber

   解析器输入的当前行号。

可被设置的处理句柄列表。 要在一个 "xmlparser" 对象 *o* 上设置处理句柄
，请使用 "o.handlername = func"。 *handlername* 必须从下面的列表中获取
，而 *func* 必须为接受正确数量参数的可调用对象。 所有参数均为字符串，
除非另外指明。

xmlparser.XmlDeclHandler(version, encoding, standalone)

   当解析 XML 声明时被调用。 XML 声明是 XML 建议适用版本、文档文本的编
   码格式，以及可选的“独立”声明的（可选）声明。 *version* 和
   *encoding* 将为字符串，而 *standalone* 在文档被声明为独立时将为 "1"
   ，在文档被声明为非独立时将为 "0"，或者在 standalone 短语被省略时则
   为 "-1"。 这仅适用于 Expat 的 1.95.0 或更新版本。

xmlparser.StartDoctypeDeclHandler(doctypeName, systemId, publicId, has_internal_subset)

   当 Expat 开始解析文档类型声明 ("<!DOCTYPE ...") 时被调用。
   *doctypeName* 会完全按所显示的被提供。 *systemId* 和 *publicId* 形
   参给出所指定的系统和公有标识符，如果被省略则为 "None"。 如果文档包
   含内部文档声明子集则 *has_internal_subset* 将为真值。 这要求 Expat
   1.2 或更新的版本。

xmlparser.EndDoctypeDeclHandler()

   当 Expat 完成解析文档类型声明时被调用。 这要求 Expat 1.2 或更新版本
   。

xmlparser.ElementDeclHandler(name, model)

   为每个元素类型声明调用一次。 *name* 为元素类型名称，而 *model* 为内
   容模型的表示形式。

xmlparser.AttlistDeclHandler(elname, attname, type, default, required)

   为一个元素类型的每个已声明属性执行调用。 如果一个属性列表声明声明了
   三个属性，这个处理句柄会被调用三次，每个属性一次。 *elname* 是声明
   所适用的元素的名称而 *attname* 是已声明的属性的名称。 属性类型是作
   为 *type* 传入的字符串；可能的值有 "'CDATA'", "'ID'", "'IDREF'",
   ... *default* 给出了当属性未被文档实例所指明时该属性的默认值，或是
   为 "None"，如果没有默认值 ("#IMPLIED" 值) 的话。 如果属性必须在文档
   实例中给出，则 *required* 将为真值。 这要求 Expat 1.95.0 或更新的版
   本。

xmlparser.StartElementHandler(name, attributes)

   在每个元素开始时被调用。 *name* 是包含元素名称的字符串，而
   *attributes* 是元素的属性。 如果 "ordered_attributes" 为真值，则属
   性为列表形式 (完整描述参见 "ordered_attributes")。 否则为将名称映射
   到值的字典。

xmlparser.EndElementHandler(name)

   在每个元素结束时被调用。

xmlparser.ProcessingInstructionHandler(target, data)

   在每次处理指令时调用。

xmlparser.CharacterDataHandler(data)

   针对字符数据调用。 此方法将被用于普通字符数据、CDATA 标记内容以及可
   忽略的空白符。 需要区分这几种情况的应用程序可以使用
   "StartCdataSectionHandler", "EndCdataSectionHandler" 和
   "ElementDeclHandler" 回调来收集必要的信息。

xmlparser.UnparsedEntityDeclHandler(entityName, base, systemId, publicId, notationName)

   针对未解析（NDATA）实体声明调用。 此方法仅存在于 Expat 库的 1. 2 版
   ；对于更新的版本，请改用 "EntityDeclHandler"。 （下层 Expat 库中的
   对应函数已被声明为过时。）

xmlparser.EntityDeclHandler(entityName, is_parameter_entity, value, base, systemId, publicId, notationName)

   针对所有实体声明被调用。 对于形参和内部实体，*value* 将为给出实体的
   声明内容的字符串；对于外部实体将为 "None"。 *notationName* 形参对于
   已解析实体将为 "None"，对于未解析实体则为标注的名称。 如果实体为形
   参实体则 *is_parameter_entity* 将为真值而如果为普通实体则为假值（大
   多数应用程序只需要关注普通实体）。 此方法仅从 1.95.0 版 Expat 库开
   始才可用。

xmlparser.NotationDeclHandler(notationName, base, systemId, publicId)

   针对标注声明被调用。 *notationName*, *base*, *systemId* 和
   *publicId* 如果给出则均应为字符串。 如果省略公有标识符，则
   *publicId* 将为 "None"。

xmlparser.StartNamespaceDeclHandler(prefix, uri)

   当一个元素包含命名空间声明时被调用。 命名空间声明会在为声明所在的元
   素调用 "StartElementHandler" 之前被处理。

xmlparser.EndNamespaceDeclHandler(prefix)

   当到达包含命名空间声明的元素的关闭标记时被调用。 此方法会按照调用
   "StartNamespaceDeclHandler" 以指明每个命名空间作用域的开始的逆顺序
   为元素上的每个命名空间声明调用一次。 对这个处理句柄的调用是在相应的
   "EndElementHandler" 之后针对元素的结束而进行的。

xmlparser.CommentHandler(data)

   针对注释被调用。 *data* 是注释的文本，不包括开头的 "'<!-""-'" 和末
   尾的 "'-""->'"。

xmlparser.StartCdataSectionHandler()

   在一个 CDATA 节的开头被调用。 需要此方法和 "EndCdataSectionHandler"
   以便能够标识 CDATA 节的语法开始和结束。

xmlparser.EndCdataSectionHandler()

   在一个 CDATA 节的末尾被调用。

xmlparser.DefaultHandler(data)

   针对 XML 文档中没有指定适用处理句柄的任何字符被调用。 这包括了所有
   属于可被报告的结构的一部分，但未提供处理句柄的字符。

xmlparser.DefaultHandlerExpand(data)

   这与 "DefaultHandler()" 相同，但不会抑制内部实体的扩展。 实体引用将
   不会被传递给默认处理句柄。

xmlparser.NotStandaloneHandler()

   当 XML 文档未被声明为独立文档时被调用。 这种情况发生在出现外部子集
   或对参数实体的引用，但 XML 声明没有在 XML 声明中将 standalone 设为
   "yes" 的时候。 如果这个处理句柄返回 "0"，那么解析器将引发
   "XML_ERROR_NOT_STANDALONE" 错误。 如果这个处理句柄没有被设置，那么
   解析器就不会为这个条件引发任何异常。

xmlparser.ExternalEntityRefHandler(context, base, systemId, publicId)

   为对外部实体的引用执行调用。 *base* 为当前的基准，由之前对
   "SetBase()" 的调用设置。 公有和系统标识符 *systemId* 和 *publicId*
   如果给出则圴为字符串；如果公有标识符未给出，则 *publicId* 将为
   "None"。 *context* 是仅根据以下说明来使用的不透明值。

   对于要解析的外部实体，这个处理句柄必须被实现。 它负责使用
   "ExternalEntityParserCreate(context)" 来创建子解析器，通过适当的回
   调将其初始化，并对实体进行解析。 这个处理句柄应当返回一个整数；如果
   它返回 "0"，则解析器将引发 "XML_ERROR_EXTERNAL_ENTITY_HANDLING" 错
   误，否则解析将会继续。

   如果未提供这个处理句柄，外部实体会由 "DefaultHandler" 回调来报告，
   如果提供了该回调的话。


ExpatError 异常
===============

"ExpatError" 异常包含几个有趣的属性:

ExpatError.code

   Expat 对于指定错误的内部错误号。 "errors.messages" 字典会将这些错误
   号映射到 Expat 的错误消息。 例如:

      from xml.parsers.expat import ParserCreate, ExpatError, errors

      p = ParserCreate()
      try:
          p.Parse(some_xml_document)
      except ExpatError as err:
          print("Error:", errors.messages[err.code])

   "errors" 模块也提供了一些错误消息常量和一个将这些消息映射回错误码的
   字典 "codes"，参见下文。

ExpatError.lineno

   检测到错误所在的行号。 首行的行号为 "1"。

ExpatError.offset

   错误发生在行中的字符偏移量。 首列的列号为 "0"。


示例
====

以下程序定义了三个处理句柄，会简单地打印出它们的参数。:

   import xml.parsers.expat

   # 3 handler functions
   def start_element(name, attrs):
       print('Start element:', name, attrs)
   def end_element(name):
       print('End element:', name)
   def char_data(data):
       print('Character data:', repr(data))

   p = xml.parsers.expat.ParserCreate()

   p.StartElementHandler = start_element
   p.EndElementHandler = end_element
   p.CharacterDataHandler = char_data

   p.Parse("""<?xml version="1.0"?>
   <parent id="top"><child1 name="paul">Text goes here</child1>
   <child2 name="fred">More text</child2>
   </parent>""", 1)

The output from this program is:

   Start element: parent {'id': 'top'}
   Start element: child1 {'name': 'paul'}
   Character data: 'Text goes here'
   End element: child1
   Character data: '\n'
   Start element: child2 {'name': 'fred'}
   Character data: 'More text'
   End element: child2
   Character data: '\n'
   End element: parent


Content Model Descriptions
==========================

Content models are described using nested tuples.  Each tuple contains
four values: the type, the quantifier, the name, and a tuple of
children.  Children are simply additional content model descriptions.

The values of the first two fields are constants defined in the
"xml.parsers.expat.model" module.  These constants can be collected in
two groups: the model type group and the quantifier group.

The constants in the model type group are:

xml.parsers.expat.model.XML_CTYPE_ANY

   The element named by the model name was declared to have a content
   model of "ANY".

xml.parsers.expat.model.XML_CTYPE_CHOICE

   The named element allows a choice from a number of options; this is
   used for content models such as "(A | B | C)".

xml.parsers.expat.model.XML_CTYPE_EMPTY

   Elements which are declared to be "EMPTY" have this model type.

xml.parsers.expat.model.XML_CTYPE_MIXED

xml.parsers.expat.model.XML_CTYPE_NAME

xml.parsers.expat.model.XML_CTYPE_SEQ

   Models which represent a series of models which follow one after
   the other are indicated with this model type.  This is used for
   models such as "(A, B, C)".

The constants in the quantifier group are:

xml.parsers.expat.model.XML_CQUANT_NONE

   No modifier is given, so it can appear exactly once, as for "A".

xml.parsers.expat.model.XML_CQUANT_OPT

   The model is optional: it can appear once or not at all, as for
   "A?".

xml.parsers.expat.model.XML_CQUANT_PLUS

   The model must occur one or more times (like "A+").

xml.parsers.expat.model.XML_CQUANT_REP

   The model must occur zero or more times, as for "A*".


Expat error constants
=====================

The following constants are provided in the "xml.parsers.expat.errors"
module.  These constants are useful in interpreting some of the
attributes of the "ExpatError" exception objects raised when an error
has occurred. Since for backwards compatibility reasons, the
constants' value is the error *message* and not the numeric error
*code*, you do this by comparing its "code" attribute with
"errors.codes[errors.XML_ERROR_*CONSTANT_NAME*]".

The "errors" module has the following attributes:

xml.parsers.expat.errors.codes

   A dictionary mapping string descriptions to their error codes.

   3.2 新版功能.

xml.parsers.expat.errors.messages

   A dictionary mapping numeric error codes to their string
   descriptions.

   3.2 新版功能.

xml.parsers.expat.errors.XML_ERROR_ASYNC_ENTITY

xml.parsers.expat.errors.XML_ERROR_ATTRIBUTE_EXTERNAL_ENTITY_REF

   An entity reference in an attribute value referred to an external
   entity instead of an internal entity.

xml.parsers.expat.errors.XML_ERROR_BAD_CHAR_REF

   A character reference referred to a character which is illegal in
   XML (for example, character "0", or '"&#0;"').

xml.parsers.expat.errors.XML_ERROR_BINARY_ENTITY_REF

   An entity reference referred to an entity which was declared with a
   notation, so cannot be parsed.

xml.parsers.expat.errors.XML_ERROR_DUPLICATE_ATTRIBUTE

   An attribute was used more than once in a start tag.

xml.parsers.expat.errors.XML_ERROR_INCORRECT_ENCODING

xml.parsers.expat.errors.XML_ERROR_INVALID_TOKEN

   Raised when an input byte could not properly be assigned to a
   character; for example, a NUL byte (value "0") in a UTF-8 input
   stream.

xml.parsers.expat.errors.XML_ERROR_JUNK_AFTER_DOC_ELEMENT

   Something other than whitespace occurred after the document
   element.

xml.parsers.expat.errors.XML_ERROR_MISPLACED_XML_PI

   An XML declaration was found somewhere other than the start of the
   input data.

xml.parsers.expat.errors.XML_ERROR_NO_ELEMENTS

   The document contains no elements (XML requires all documents to
   contain exactly one top-level element)..

xml.parsers.expat.errors.XML_ERROR_NO_MEMORY

   Expat was not able to allocate memory internally.

xml.parsers.expat.errors.XML_ERROR_PARAM_ENTITY_REF

   A parameter entity reference was found where it was not allowed.

xml.parsers.expat.errors.XML_ERROR_PARTIAL_CHAR

   An incomplete character was found in the input.

xml.parsers.expat.errors.XML_ERROR_RECURSIVE_ENTITY_REF

   An entity reference contained another reference to the same entity;
   possibly via a different name, and possibly indirectly.

xml.parsers.expat.errors.XML_ERROR_SYNTAX

   Some unspecified syntax error was encountered.

xml.parsers.expat.errors.XML_ERROR_TAG_MISMATCH

   An end tag did not match the innermost open start tag.

xml.parsers.expat.errors.XML_ERROR_UNCLOSED_TOKEN

   Some token (such as a start tag) was not closed before the end of
   the stream or the next token was encountered.

xml.parsers.expat.errors.XML_ERROR_UNDEFINED_ENTITY

   A reference was made to an entity which was not defined.

xml.parsers.expat.errors.XML_ERROR_UNKNOWN_ENCODING

   The document encoding is not supported by Expat.

xml.parsers.expat.errors.XML_ERROR_UNCLOSED_CDATA_SECTION

   A CDATA marked section was not closed.

xml.parsers.expat.errors.XML_ERROR_EXTERNAL_ENTITY_HANDLING

xml.parsers.expat.errors.XML_ERROR_NOT_STANDALONE

   The parser determined that the document was not "standalone" though
   it declared itself to be in the XML declaration, and the
   "NotStandaloneHandler" was set and returned "0".

xml.parsers.expat.errors.XML_ERROR_UNEXPECTED_STATE

xml.parsers.expat.errors.XML_ERROR_ENTITY_DECLARED_IN_PE

xml.parsers.expat.errors.XML_ERROR_FEATURE_REQUIRES_XML_DTD

   An operation was requested that requires DTD support to be compiled
   in, but Expat was configured without DTD support.  This should
   never be reported by a standard build of the "xml.parsers.expat"
   module.

xml.parsers.expat.errors.XML_ERROR_CANT_CHANGE_FEATURE_ONCE_PARSING

   A behavioral change was requested after parsing started that can
   only be changed before parsing has started.  This is (currently)
   only raised by "UseForeignDTD()".

xml.parsers.expat.errors.XML_ERROR_UNBOUND_PREFIX

   An undeclared prefix was found when namespace processing was
   enabled.

xml.parsers.expat.errors.XML_ERROR_UNDECLARING_PREFIX

   The document attempted to remove the namespace declaration
   associated with a prefix.

xml.parsers.expat.errors.XML_ERROR_INCOMPLETE_PE

   A parameter entity contained incomplete markup.

xml.parsers.expat.errors.XML_ERROR_XML_DECL

   The document contained no document element at all.

xml.parsers.expat.errors.XML_ERROR_TEXT_DECL

   There was an error parsing a text declaration in an external
   entity.

xml.parsers.expat.errors.XML_ERROR_PUBLICID

   Characters were found in the public id that are not allowed.

xml.parsers.expat.errors.XML_ERROR_SUSPENDED

   The requested operation was made on a suspended parser, but isn't
   allowed.  This includes attempts to provide additional input or to
   stop the parser.

xml.parsers.expat.errors.XML_ERROR_NOT_SUSPENDED

   An attempt to resume the parser was made when the parser had not
   been suspended.

xml.parsers.expat.errors.XML_ERROR_ABORTED

   This should not be reported to Python applications.

xml.parsers.expat.errors.XML_ERROR_FINISHED

   The requested operation was made on a parser which was finished
   parsing input, but isn't allowed.  This includes attempts to
   provide additional input or to stop the parser.

xml.parsers.expat.errors.XML_ERROR_SUSPEND_PE

-[ 脚注 ]-

[1] 包括在 XML 输出中的编码格式字符串应当符合适当的标准。 例如 "UTF-8"
    是有效的，但 "UTF8" 是无效的。 请参阅 https://www.w3.org/TR/2006
    /REC-xml11-20060816/#NT-EncodingDecl 和
    https://www.iana.org/assignments/character-sets/character-
    sets.xhtml。
