Python字符串的编码转换是指将一个字符串从一种编码方式转换为另一种编码方式,例如从Unicode编码转换为UTF-8编码,或者从GBK编码转换为UTF-8编码。不同的编码方式可以支持不同的字符集,例如UTF-8编码可以支持多种语言的字符,而GBK编码主要支持中文字符。在Python中,有多种方法可以实现字符串的编码转换
- 方法一:使用encode()和decode()方法。这两个方法可以将一个字符串从一种编码方式转换为另一种编码方式,例如:
# 将Unicode编码的字符串转换为UTF-8编码的字符串
s1 = "你好"
s2 = s1.encode("utf-8") # 使用encode()方法,指定目标编码方式为utf-8
print(s2) # b'\xe4\xbd\xa0\xe5\xa5\xbd'
# 将UTF-8编码的字符串转换为Unicode编码的字符串
s3 = s2.decode("utf-8") # 使用decode()方法,指定源编码方式为utf-8
print(s3) # 你好
- 方法二:使用str()函数。这个函数可以将一个对象转换为字符串,如果指定了encoding参数,那么就会按照指定的编码方式进行转换,例如:
# 将bytes对象转换为字符串
b1 = b'\xe4\xbd\xa0\xe5\xa5\xbd' # 这是一个UTF-8编码的bytes对象
s4 = str(b1, encoding="utf-8") # 使用str()函数,指定encoding参数为utf-8
print(s4) # 你好
# 将字符串转换为bytes对象
s5 = "你好"
b2 = str(s5, encoding="utf-8") # 使用str()函数,指定encoding参数为utf-8
print(b2) # b'\xe4\xbd\xa0\xe5\xa5\xbd'
- 方法三:使用bytes()函数。这个函数可以将一个对象转换为bytes对象,如果指定了encoding参数,那么就会按照指定的编码方式进行转换,例如:
# 将字符串转换为bytes对象
s6 = "你好"
b3 = bytes(s6, encoding="utf-8") # 使用bytes()函数,指定encoding参数为utf-8
print(b3) # b'\xe4\xbd\xa0\xe5\xa5\xbd'
# 将bytes对象转换为字符串
b4 = b'\xe4\xbd\xa0\xe5\xa5\xbd' # 这是一个UTF-8编码的bytes对象
s7 = bytes(b4, encoding="utf-8") # 使用bytes()函数,指定encoding参数为utf-8
print(s7) # 你好
本文暂时没有评论,来添加一个吧(●'◡'●)