decode()
函数是用于将字符串从指定的编码格式解码为 Unicode 字符串。以下是一个使用 decode()
函数的示例:
# 定义一个字节串
byte_string = b'\xe4\xbd\xa0\xe5\xa5\xbd'
# 解码字节串为 Unicode 字符串(默认使用 UTF-8 编码)
unicode_string = byte_string.decode()
# 打印解码结果
print(unicode_string)
输出结果:
你好
在上面的示例中,我们定义了一个字节串 byte_string
,它使用 UTF-8 编码表示了 “你好” 这两个字符。然后,我们使用 decode()
函数将字节串解码为 Unicode 字符串,并将结果赋值给 unicode_string
变量。最后,通过打印 unicode_string
,我们可以看到成功解码的结果为 “你好”。
需要注意的是,decode()
函数的参数可以指定要使用的编码格式。如果字节串采用的是除了默认的 UTF-8 以外的编码方式,你需要在 decode()
函数中指定正确的编码格式。
例如,如果字节串采用的是 GBK 编码,可以按如下方式解码:
byte_string = b'\xc4\xe3\xba\xc3'
unicode_string = byte_string.decode('gbk')
print(unicode_string)
输出结果:
你好
这样就可以正确地将字节串解码为相应的 Unicode 字符串。