19. 構造化マークアップツール¶
Python は様々な構造化データマークアップ形式を扱うための、様々なモジュールをサポートしています。これらは標準化一般マークアップ言語 (SGML) およびハイパーテキストマークアップ言語 (HTML)、そして可拡張性マークアップ言語 (XML) を扱うためのいくつかのインタフェースからなります。
注意すべき重要な点として、 xml
パッケージは少なくとも一つの SAX に対応した XML パーザが利用可能でなければなりません。 Python 2.3 からは Expat パーザが Python に取り込まれているので、 xml.parsers.expat
モジュールは常に利用できます。また、 PyXML 追加パッケージ についても知りたいと思うかもしれません; このパッケージは Python 用の拡張された XML ライブラリセットを提供します。
xml.dom
および xml.sax
パッケージのドキュメントは Python による DOM および SAX インタフェースへのバインディングに関する定義です。
- 19.1.
HTMLParser
--- HTML および XHTML のシンプルなパーサー - 19.2.
sgmllib
--- 単純な SGML パーザ - 19.3.
htmllib
--- HTML 文書の解析器 - 19.4.
htmlentitydefs
--- HTML 一般エンティティの定義 - 19.5. XMLを扱うモジュール群
- 19.6. XML の脆弱性
- 19.7.
xml.etree.ElementTree
--- ElementTree XML API - 19.8.
xml.dom
--- 文書オブジェクトモデル (DOM) API- 19.8.1. モジュールコンテンツ
- 19.8.2. DOM 内のオブジェクト
- 19.8.2.1. DOMImplementation オブジェクト
- 19.8.2.2. Node オブジェクト
- 19.8.2.3. NodeList オブジェクト
- 19.8.2.4. DocumentType オブジェクト
- 19.8.2.5. Document オブジェクト
- 19.8.2.6. Element オブジェクト
- 19.8.2.7. Attr オブジェクト
- 19.8.2.8. NamedNodeMap Objects
- 19.8.2.9. Comment オブジェクト
- 19.8.2.10. Text オブジェクトおよび CDATASection オブジェクト
- 19.8.2.11. ProcessingInstruction オブジェクト
- 19.8.2.12. 例外
- 19.8.3. 適合性
- 19.9.
xml.dom.minidom
--- 最小限の DOM の実装 - 19.10.
xml.dom.pulldom
--- 部分的な DOM ツリー構築のサポート - 19.11.
xml.sax
--- SAX2 パーサのサポート - 19.12.
xml.sax.handler
--- SAX ハンドラの基底クラス - 19.13.
xml.sax.saxutils
--- SAX ユーティリティ - 19.14.
xml.sax.xmlreader
--- XML パーサのインタフェース - 19.15.
xml.parsers.expat
--- Expat を使った高速な XML 解析