1
vibbow 2014-01-09 19:28:38 +08:00 1
是的,有些日文和中文字看起来比较相似的,UTF-8编码也是一样的
具体显示时是用日文字体还是中文字体,就根据你的系统语言首选项了 (反正如果首选项是英文的话,用的是日文字体) |
2
ichigo 2014-01-09 19:36:13 +08:00
很多汉字写法还是有细微差别的,编码应该不同吧。
|
3
Semidio 2014-01-09 19:45:28 +08:00 1
unicode是一套通用字符编码集,它不可能给同一个字符多个不同的编码,即使这个字符在多种语言中被使用。其实不只是unicode,绝大多数字符编码都只按字形,同形字全部同编码,只有极少数编码格式严格按照字音给同形字多个编码。
|
5
Semidio 2014-01-09 19:49:05 +08:00
@ichigo unicode关于同形字的处理,如果是在不同语言环境下,即使写法不同依然同编码,但是如果是同一语言环境,则视为异体字,给予不同编码。至于这些同编码的同形字在写法上的区别则只能靠字体来体现。
|
7
exoticknight 2014-01-09 20:06:10 +08:00
感谢楼主,之前也是有这样的疑问
|
8
VYSE 2014-01-10 00:28:35 +08:00
尼玛这才意识到UTF-8 ENCODE亚洲字符好长好低效啊!!
看看人家j.encode('utf-16') |
9
hanliinter 2014-01-11 01:25:35 +08:00
这个问题就是Unihan吧 http://en.wikipedia.org/wiki/Han_unification
|