两段看起来一模一样的文字,竟然有着不同的内部编码,有没有什么方法可以将它们相互转换?
스크린샷 2016-09-11 오전
\Uc2a4\Ud06c\Ub9b0\Uc0f7 2016-09-11 \Uc624\Uc804
스크린샷 2016-09-11 오전
\U1109\U1173\U110f\U1173\U1105\U1175\U11ab\U1109\U1163\U11ba 2016-09-11 \U110b\U1169\U110c\U1165\U11ab
@imn1 已找到解决方案,非常感谢你的指点!
NSString *tc = @"ㅁㅏ";
NSLog(@"tc: '%@'", tc);
NSString *cc = [tc precomposedStringWithCompatibilityMapping];
NSLog(@"cc: '%@'", cc);
1
imn1 2016-09-16 12:01:49 +08:00 1
第一个是 unicode
第二个是键码(拆字),拆字后的 unicode ,懂韩语或其输入法的会知道 如 스(c2a4) 拆成 ᄉ(1109) 和 ᅳ(1173) |
2
imn1 2016-09-16 12:12:18 +08:00
看上去第二个是输入错误引起的
如第一例中 린,韩语常用输入是二或三键构成一个字(空格断字),ᄅ 1105 ,ᅵ 1175 ,ᆫ 11ab ,刚好就是第二例中的 린 感觉是输入法用错了,韩文有输入法是 2 键输入,但输入的人仍然用了习惯的三键,就变成第二例 |