开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 5844|回复: 21
打印 上一主题 下一主题
收起左侧

[易语言纯源码] [洫蜘蛛] 编码转换模块!

[复制链接]
跳转到指定楼层
楼主
发表于 2018-10-20 10:39:18 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式   云南省昆明市
分享源码
界面截图:
是否带模块: 纯源码
备注说明: -
本帖最后由 洫蜘蛛 于 2018-10-20 10:42 编辑

易语言的使用中,不可避免的需要转换文本的编码,众所周知,大家都用这两个API:
  1. MultiByteToWideChar
  2. WideCharToMultiByte
复制代码

但是,这两个API稍微不对就得叫你的程序完蛋!!!
昨晚又仔细参考的MSDN文档,有两个关键字非常需要注意:
  1. 字符
  2. 字节
复制代码

是的,字符和字节,一个参数指定的是缓冲区字符数,一个是缓冲区字节数。
所以,这次我直接根据编码的最大可能字节数来手动计算缓冲区大小。
例如:UTF8,一个字符最多使用6个字节,转换时缓冲区大小就设为字符数的6倍大小字节空间。
预览图:

安全的做法是直接申请足够大的空间来进行转换,所以重新封装了一下编码转换!
请尽量在XP系统并且多线程环境下测试,有问题欢迎联系反馈!

下面上模块源码:
编码转换.e (9.24 KB, 下载次数: 149)

点评

补充:最好别用api取长度来计算,也别用api自动计算需要的缓冲区,他们都是不靠谱的。   云南省昆明市  发表于 2018-10-20 17:40

评分

参与人数 6好评 +5 精币 +19 收起 理由
胜屿 + 1 + 2 感谢分享,很给力!~
被封禁言 + 1 支持开源~!感谢分享
¢刀丛里的诗 + 1 + 1 支持开源~!感谢分享
ikumu + 1 + 1 支持开源~!感谢分享
福仔 + 1 + 4 感谢分享,很给力!~
冰点 + 1 + 10 支持开源~!感谢分享

查看全部评分


结帖率:100% (6/6)

签到天数: 12 天

沙发
发表于 2018-10-20 10:51:22 | 只看该作者   浙江省温州市
转换速度快吗 像精易那个编码转换速度就超级慢

点评

这个速度应该蛮快的了,虽然还能提速,但是暂时先这样。   云南省昆明市  详情 回复 发表于 2018-10-20 10:56
回复 支持 反对

使用道具 举报

板凳
 楼主| 发表于 2018-10-20 10:56:49 | 只看该作者   云南省昆明市
a16633 发表于 2018-10-20 10:51
转换速度快吗 像精易那个编码转换速度就超级慢

这个速度应该蛮快的了,虽然还能提速,但是暂时先这样。
这次发的主要是避免编码转换时造成的程序崩溃问题
这两个API很容易造成程序崩溃的。
回复 支持 反对

使用道具 举报

结帖率:100% (9/9)

签到天数: 18 天

地板
发表于 2018-10-20 11:07:51 | 只看该作者   广西壮族自治区崇左市
注意:使用MultiByteToWideChar函数可能会危及应用程序的安全性。调用此函数很容易导致缓冲区溢出,因为lpMultiByteStr指示的输入缓冲区的大小等于字符串中的字节数,而lpWideCharStr指示的输出缓冲区的大小等于字符数。为避免缓冲区溢出,应用程序必须指定适合缓冲区接收的数据类型的缓冲区大小。

cbMultiByte
由lpMultiByteStr指示的缓冲区的大小(以字节为单位)。如果此参数设置为0,则该函数返回lpMultiByteStr所需的缓冲区大小,并且不使用输出参数本身。

cchWideChar
由lpWideCharStr指示的缓冲区的大小(以字符为单位)。如果此值为0,则该函数返回所需的缓冲区大小(以字符为单位),包括任何终止空字符,并且不使用lpWideCharStr缓冲区。

以上由msdn翻译过来的....
两个API都有个参数,填0返回缓冲区所需要的大小,所以 缓冲区大小还是交给他计算.........

点评

如上面提到的那样,如果首先在cchWideChar设置为0的情况下调用此函数以便获得所需的大小,则输出缓冲区很容易溢出。如果使用MB_COMPOSITE标志,则每个输入字符的输出长度可以是三个或更多字符。 原来备注后面还有   广西壮族自治区崇左市  详情 回复 发表于 2018-10-20 11:18
最好别偷懒,它完全不靠谱的!   云南省昆明市  发表于 2018-10-20 11:17
回复 支持 0 反对 1

使用道具 举报

结帖率:100% (9/9)

签到天数: 18 天

地下
发表于 2018-10-20 11:18:44 | 只看该作者   广西壮族自治区崇左市
福仔 发表于 2018-10-20 11:07
注意:使用MultiByteToWideChar函数可能会危及应用程序的安全性。调用此函数很容易导致缓冲区溢出,因为lpM ...

如上面提到的那样,如果首先在cchWideChar设置为0的情况下调用此函数以便获得所需的大小,则输出缓冲区很容易溢出。如果使用MB_COMPOSITE标志,则每个输入字符的输出长度可以是三个或更多字符。

原来备注后面还有这么一段,由API计算的缓冲区容易造成缓冲区溢出....

点评

所以明白我为何要自行计算空间而不用api去计算了   云南省昆明市  详情 回复 发表于 2018-10-20 17:39
回复 支持 反对

使用道具 举报

结帖率:100% (26/26)
6
发表于 2018-10-20 11:59:12 | 只看该作者   浙江省杭州市
其实很简单, 给一段未知的字节, 无论它有没有字符串截止符\0, 既然要牺牲空间, 那最安全的办法就是多申请一个字符的长度(字符, 不是字节, 简而言之, 宽字符+2, 窄字符+1), 拷贝一份源数据, 用 strlen 就可以很安全地获取到该字符串的确切长度.

还有长度是可以传入的, 只需要保证正确就可以了, 不浪费空间的前提下一样可以保证正确性:

  
utf8_Len = 取字节集长度 (utf8)
如果真 (utf8_Len = 0)
返回 (“”)

pUtf8 = 取变量数据地址_字节集 (utf8)
utf8_Len2 = lstrlenA (pUtf8)
如果真 (0 ≤ utf8_Len2 utf8_Len2 ≤ utf8_Len)
utf8_Len = utf8_Len2

这样就把几种错误的情况都考虑到了:
1.有且仅有一个截止符, 而且截止符在字符串的结尾;
2.截止符在字符串的中间;
3.没有截止符.

至于 utf-8 的 6 倍我觉得实在有点浪费, 这两个出错有两种原因: 一是因为没有截止符导致缓冲区过大, 二是没有分清楚宽窄字节的长度的区别导致缓冲区过小。

评分

参与人数 1好评 +1 精币 +1 收起 理由
¢刀丛里的诗 + 1 + 1 新技能已get√

查看全部评分

回复 支持 反对

使用道具 举报

结帖率:100% (26/26)
7
发表于 2018-10-20 12:00:17 | 只看该作者   浙江省杭州市
本帖最后由 镇坛道德标杆 于 2018-10-20 12:02 编辑

# 论坛抽风   发重复了
回复 支持 反对

使用道具 举报

结帖率:100% (8/8)
8
发表于 2018-10-20 14:24:35 | 只看该作者   菲律宾
感谢楼主分享源码及经验
回复 支持 反对

使用道具 举报

结帖率:100% (11/11)

签到天数: 12 天

9
发表于 2018-10-20 14:42:04 | 只看该作者   陕西省渭南市
又百度了一下.原来是un码车utf8时会产生6字节.
回复 支持 反对

使用道具 举报

10
 楼主| 发表于 2018-10-20 17:39:31 | 只看该作者   云南省昆明市
福仔 发表于 2018-10-20 11:18
如上面提到的那样,如果首先在cchWideChar设置为0的情况下调用此函数以便获得所需的大小,则输出缓冲区很 ...

所以明白我为何要自行计算空间而不用api去计算了
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:[email protected]
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表