encode()
和 decode()
是 Python 字符串对象的方法,用于进行字符串的编码和解码操作。
encode(encoding, errors)
:将字符串编码为指定的编码格式。encoding
:要使用的编码格式,例如 UTF-8、GBK 等。errors
(可选):指定编码错误处理方式,常用的有'strict'
(默认,抛出 UnicodeEncodeError 异常)、'ignore'
(忽略无法编码的字符)、'replace'
(用特殊字符替代无法编码的字符)等。
decode(encoding, errors)
:将已编码的字符串解码为 Unicode 字符串。encoding
:已编码字符串的编码格式,必须与实际编码一致。errors
(可选):指定解码错误处理方式,常用的有'strict'
(默认,抛出 UnicodeDecodeError 异常)、'ignore'
(忽略无法解码的字节序列)、'replace'
(用特殊字符替代无法解码的字节序列)等。
以下示例展示了 encode()
和 decode()
的用法:
# 字符串编码为字节串
str1 = '你好'
byte_string = str1.encode('utf-8')
print(byte_string) # b'\xe4\xbd\xa0\xe5\xa5\xbd'
# 字节串解码为字符串
str2 = byte_string.decode('utf-8')
print(str2) # 你好
在上述示例中,首先使用 encode('utf-8')
将字符串 str1
编码为 UTF-8 编码的字节串 byte_string
。然后,使用 decode('utf-8')
将字节串 byte_string
解码为字符串 str2
。最终,通过打印输出可以看到编码和解码操作的结果。
需要注意的是,编码和解码操作涉及到字符集和编码格式的处理,确保在进行编码和解码时使用相同的字符集和编码格式,以避免出现乱码或错误的结果。