精易论坛

标题: 关于网页乱码<&#*****;>的转换 [打印本页]

作者: watfe    时间: 2010-12-7 18:25
标题: 关于网页乱码<&#*****;>的转换
本帖最后由 watfe 于 2010-12-7 18:35 编辑

今天偶然获取到这样一段源码:

& #27996;盩& #12417;& #12402;

网页是BIG5的编码,可是BIG5转GB18030之后变成:

& #27996崎& #12417;& #12402;(只转了一个“”字,&#*****;依旧没变)

后来遍历了一下所有的编码,发现\u+取16进制后编码 进行 #编码_C99 转 #编码_GB2312 可以转 &#*****;,于是正则提取,逐个转换得到:

めひ

解码成功,至此解码完毕。


源码发上来,以后有遇到&#*****;的朋友不必挠头了(源码调用彗星正则模块,不喜模块的自己改源码)

未命名.JPG (27.3 KB, 下载次数: 30)

未命名.JPG

未命名.JPG (168.97 KB, 下载次数: 29)

未命名.JPG

网页乱码&#....转换.rar

2.34 KB, 下载次数: 112, 下载积分: 精币 -2 枚


作者: huanlong    时间: 2010-12-10 04:45
学习下吧··
作者: qq3324686    时间: 2011-1-4 12:45
提示: 作者被禁止或删除 内容自动屏蔽
作者: 忆如燕    时间: 2011-10-1 21:52
正在学习,谢谢 了
作者: 南飞的雁    时间: 2011-11-18 18:08
这个我用到,谢谢
作者: wangjianaijiao    时间: 2013-2-8 14:33
看看学习学习
作者: diannaoleyuan    时间: 2013-3-31 21:22
看看学习学习
作者: z406460897    时间: 2018-1-19 16:18
1111111111111111
作者: cyt777    时间: 2022-9-3 10:24
很好 谢谢你很有用?




欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4