精易论坛

标题: 文本内有 喔 字为什么是UTF-8呢 [打印本页]

作者: Loveyou_豪猪    时间: 2022-11-19 16:02
标题: 文本内有 喔 字为什么是UTF-8呢
明明是ANSI的文本,里面只有一个 喔 字为什么是UTF-8呢

作者: 闻v风    时间: 2022-11-19 16:02
设置为utf8编码的时候
猜测可能是
有双字节的 就会是utf8
如果全是单字节的明明设置为utf8最终保存的也会是ansi
喔是汉字肯定是双字节的
具体可以试试,用个非自带记事本 写入一串数字字母另存为utf8  得到的会是一个ansi或者说gb2312编码的文件
再加入一个双字节的汉字或符号,另存utf8 这时会得到一个utf8的文件
作者: Loveyou_豪猪    时间: 2022-11-19 16:06
文本明明是ANSI 里面只有一个喔 字
文本_是否UTF8_汇编 (读入文件 (文件路径)) = 真  
文件_取文本编码  也是 = 1
作者: Siempre    时间: 2022-11-19 16:19
说明喔被两次utf8了
作者: Loveyou_豪猪    时间: 2022-11-19 19:25
闻v风 发表于 2022-11-19 16:08
设置为utf8编码的时候
猜测可能是
有双字节的 就会是utf8

只要是文本里面带 喔 的 ANSI文本,都会被 文本_是否UTF8_汇编或文件_取文本编码 认为是 UTF8
作者: Loveyou_豪猪    时间: 2022-11-19 19:25
Siempre 发表于 2022-11-19 16:19
说明喔被两次utf8了

不是,只检测。
只要是文本里面带 喔 的 ANSI文本,都会被 文本_是否UTF8_汇编或文件_取文本编码 认为是 UTF8
作者: 闻v风    时间: 2022-11-19 20:26
Loveyou_豪猪 发表于 2022-11-19 19:25
只要是文本里面带 喔 的 ANSI文本,都会被 文本_是否UTF8_汇编或文件_取文本编码 认为是 UTF8 ...

可能是这个函数有BUG吧。
你可以去提交一下BUG
临时使用的话,你可以在判断编码前先寻找判断一下,有这个字先替换成别的 再判断编码
作者: 陽陽陽    时间: 2022-11-20 03:19
Loveyou_豪猪 发表于 2022-11-19 19:25
只要是文本里面带 喔 的 ANSI文本,都会被 文本_是否UTF8_汇编或文件_取文本编码 认为是 UTF8 ...

提交一下BUG吧
作者: 果心豆腐酱    时间: 2022-11-20 03:34
Loveyou_豪猪 发表于 2022-11-19 19:25
不是,只检测。
只要是文本里面带 喔 的 ANSI文本,都会被 文本_是否UTF8_汇编或文件_取文本编码 认为是  ...

不然,你以为乱码的文字,是哪来的?
不止  喔 大部分的乱码文字,都会被认为是UTF-8。比如   龃  魟  

其实,就是检测文本里面,有没有乱码文字
作者: chenyucheng    时间: 2022-12-26 09:46
果心豆腐酱 发表于 2022-11-20 03:34
不然,你以为乱码的文字,是哪来的?
不止  喔 大部分的乱码文字,都会被认为是UTF-8。比如   龃  魟  

记事本输入“联通”保存再双击打开出现乱码
作者: chenyucheng    时间: 2022-12-26 09:50
Loveyou_豪猪 发表于 2022-11-19 19:25
不是,只检测。
只要是文本里面带 喔 的 ANSI文本,都会被 文本_是否UTF8_汇编或文件_取文本编码 认为是  ...

历史有这么一件事:记事本输入“联通”,保存再双击打开出现乱码

你也可以拿“联通”试试检测
作者: 果心豆腐酱    时间: 2022-12-26 14:33
chenyucheng 发表于 2022-12-26 09:46
记事本输入“联通”保存再双击打开出现乱码

WIN11不会.




欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4