python 中怎么判断编码的兼容性?

在 python 中,strjoin=str1+str2,如果 str1(ascii 编码)和 str2(utf-8 编码)的编码方式不一致,比如,那么 strjoin 将是个'奇怪的字符串',自身就有两种不同的编码. 这种情况往往导致 strjoin 显示为乱码. 在 ruby 中,当执行 strjoin=str1+str2 时,ruby 会检验 str1 编码和 str2 的编码,以及这两个编码是否兼容(例如,utf-8 编码就可以兼容 ascii 编码),如果兼容,就统一使用兼容性的编码作为 strjoin 的编码. 检查编码兼容性的伪代码如下:

Encoding.compatible?(coding1, coding2)

如果 coding1 兼容 coding2 编码,则返回 coding1;如果 coding2 兼容 coding1,则返回 coding2;如果 coding1 和 coding2 没有兼容性,则返回 false.

我想问的是,python 中是否有类似的方法或者模块,来检查编码的兼容性? 多谢!

编码

strjoin

coding1

coding2

7 条回复 • 2016-10-06 04:38:40 +08:00

jimzhong

2016-10-05 18:44:21 +08:00

python3 里面 str 采用 unicode 存储，不存在编码问题。

binux

2016-10-05 18:53:59 +08:00

这是一个 xy 问题，你理解错了
1. python 中（我理解你使用的 python2 ） str 是 bytes 类型，对编码无感知。
2. ascii 是 utf8 的子集，即使 strjoin ，也不存在两种不同的编码一说
3. 显示为乱码，与「编码兼容」无关。而是你终端编码和输出编码不同。