编解码器注册与支持功能¶
-
int
PyCodec_Register
(PyObject *search_function)¶ 注册一个新的编解码器搜索函数。
作为副作用,其尝试加载
encodings
包,如果尚未完成,请确保它始终位于搜索函数列表的第一位。
-
int
PyCodec_KnownEncoding
(const char *encoding)¶ Return
1
or0
depending on whether there is a registered codec for the given encoding.
-
PyObject*
PyCodec_Encode
(PyObject *object, const char *encoding, const char *errors)¶ 泛型编解码器基本编码 API。
object is passed through the encoder function found for the given encoding using the error handling method defined by errors. errors may be NULL to use the default method defined for the codec. Raises a
LookupError
if no encoder can be found.
-
PyObject*
PyCodec_Decode
(PyObject *object, const char *encoding, const char *errors)¶ 泛型编解码器基本解码 API。
object is passed through the decoder function found for the given encoding using the error handling method defined by errors. errors may be NULL to use the default method defined for the codec. Raises a
LookupError
if no encoder can be found.
Codec 查找API¶
In the following functions, the encoding string is looked up converted to all
lower-case characters, which makes encodings looked up through this mechanism
effectively case-insensitive. If no codec is found, a KeyError
is set
and NULL returned.
-
PyObject*
PyCodec_IncrementalEncoder
(const char *encoding, const char *errors)¶ 为给定的 encoding 获取一个
IncrementalEncoder
对象。
-
PyObject*
PyCodec_IncrementalDecoder
(const char *encoding, const char *errors)¶ 为给定的 encoding 获取一个
IncrementalDecoder
对象。
-
PyObject*
PyCodec_StreamReader
(const char *encoding, PyObject *stream, const char *errors)¶ 为给定的 encoding 获取一个
StreamReader
工厂函数。
-
PyObject*
PyCodec_StreamWriter
(const char *encoding, PyObject *stream, const char *errors)¶ 为给定的 encoding 获取一个
StreamWriter
工厂函数。
用于Unicode编码错误处理程序的注册表API¶
-
int
PyCodec_RegisterError
(const char *name, PyObject *error)¶ 在给定的 name 之下注册错误处理回调函数 error。 该回调函数将在一个编解码器遇到无法编码的字符/无法解码的字节数据并且 name 被指定为 encode/decode 函数调用的 error 形参时由该编解码器来调用。
该回调函数会接受一个
UnicodeEncodeError
,UnicodeDecodeError
或UnicodeTranslateError
的实例作为单独参数,其中包含关于有问题字符或字节序列及其在原始序列的偏移量信息(请参阅 Unicode Exception Objects 了解提取此信息的函数详情)。 该回调函数必须引发给定的异常,或者返回一个包含有问题序列及相应替换序列的二元组,以及一个表示偏移量的整数,该整数指明应在什么位置上恢复编码/解码操作。成功则返回``0`` ,失败则返回``-1``