编解码器注册与支持功能

int PyCodec_Register(PyObject *search_function)

注册一个新的编解码器搜索函数。

作为副作用,其尝试加载 encodings 包,如果尚未完成,请确保它始终位于搜索函数列表的第一位。

int PyCodec_KnownEncoding(const char *encoding)

Return 1 or 0 depending on whether there is a registered codec for the given encoding.

PyObject* PyCodec_Encode(PyObject *object, const char *encoding, const char *errors)

泛型编解码器基本编码 API。

object is passed through the encoder function found for the given encoding using the error handling method defined by errors. errors may be NULL to use the default method defined for the codec. Raises a LookupError if no encoder can be found.

PyObject* PyCodec_Decode(PyObject *object, const char *encoding, const char *errors)

泛型编解码器基本解码 API。

object is passed through the decoder function found for the given encoding using the error handling method defined by errors. errors may be NULL to use the default method defined for the codec. Raises a LookupError if no encoder can be found.

Codec 查找API

In the following functions, the encoding string is looked up converted to all lower-case characters, which makes encodings looked up through this mechanism effectively case-insensitive. If no codec is found, a KeyError is set and NULL returned.

PyObject* PyCodec_Encoder(const char *encoding)

为给定的 encoding 获取一个编码器函数。

PyObject* PyCodec_Decoder(const char *encoding)

为给定的 encoding 获取一个解码器函数。

PyObject* PyCodec_IncrementalEncoder(const char *encoding, const char *errors)

为给定的 encoding 获取一个 IncrementalEncoder 对象。

PyObject* PyCodec_IncrementalDecoder(const char *encoding, const char *errors)

为给定的 encoding 获取一个 IncrementalDecoder 对象。

PyObject* PyCodec_StreamReader(const char *encoding, PyObject *stream, const char *errors)

为给定的 encoding 获取一个 StreamReader 工厂函数。

PyObject* PyCodec_StreamWriter(const char *encoding, PyObject *stream, const char *errors)

为给定的 encoding 获取一个 StreamWriter 工厂函数。

用于Unicode编码错误处理程序的注册表API

int PyCodec_RegisterError(const char *name, PyObject *error)

在给定的 name 之下注册错误处理回调函数 error。 该回调函数将在一个编解码器遇到无法编码的字符/无法解码的字节数据并且 name 被指定为 encode/decode 函数调用的 error 形参时由该编解码器来调用。

该回调函数会接受一个 UnicodeEncodeError, UnicodeDecodeErrorUnicodeTranslateError 的实例作为单独参数,其中包含关于有问题字符或字节序列及其在原始序列的偏移量信息(请参阅 Unicode Exception Objects 了解提取此信息的函数详情)。 该回调函数必须引发给定的异常,或者返回一个包含有问题序列及相应替换序列的二元组,以及一个表示偏移量的整数,该整数指明应在什么位置上恢复编码/解码操作。

成功则返回``0`` ,失败则返回``-1``

PyObject* PyCodec_LookupError(const char *name)

Lookup the error handling callback function registered under name. As a special case NULL can be passed, in which case the error handling callback for 「strict」 will be returned.

PyObject* PyCodec_StrictErrors(PyObject *exc)

引发 exc 作为异常。

PyObject* PyCodec_IgnoreErrors(PyObject *exc)

忽略 unicode 错误,跳过错误的输入。

PyObject* PyCodec_ReplaceErrors(PyObject *exc)

使用 ?U+FFFD 替换 unicode 编码错误。

PyObject* PyCodec_XMLCharRefReplaceErrors(PyObject *exc)

使用 XML 字符引用替换 unicode 编码错误。

PyObject* PyCodec_BackslashReplaceErrors(PyObject *exc)

使用反斜杠转义符 (\x, \u\U) 替换 unicode 编码错误。

PyObject* PyCodec_NameReplaceErrors(PyObject *exc)

使用 \N{...} 转义符替换 unicode 编码错误。

3.5 版新加入.