精易论坛

标题: 取拼音、拼音声调,非http读网页(第二次修正) [打印本页]

作者: 深寒    时间: 昨天 13:16
标题: 取拼音、拼音声调,非http读网页(第二次修正)
本帖最后由 深寒 于 2025-7-3 12:55 编辑

本来只是失败的订单,随便发了个帖子,万万没想到需要的人还挺多。于是根据易友的建议做了部分改进,相对于之前发的版本,做了以下调整。

1、改进了拼音库。现在拼音库支持的汉字、生僻字达到 20854 个(涵盖绝大部分的GBK支持的中文字符,GBK收录的中文字21003个
2、改进了多音字库,现在多音字库、录入多音字相关的词(成)语达到4089个
3、重新定义DLL命令:取单个汉字拼音。现在支持两个命令:



  
DLL命令名返回值类型公开备 注
易_长文本转拼音文本型 
DLL库文件名:
pinyin.dll
在DLL库中对应命令名:
E_LongtextTopinyin
参数名类 型传址数组备 注
字符串文本型要转换的字符串
取出类型整数型0:拼音 1:拼音带声调
DLL命令名返回值类型公开备 注
易_取汉字拼音文本型 取单个中文字符的拼音,多个字符或非中文字符返回空值
DLL库文件名:
pinyin.dll
在DLL库中对应命令名:
E_GetPinyin
参数名类 型传址数组备 注
中文文本型单个中文字符
取出类型整数型0:拼音 1:拼音带声调
拼音索引整数型取第几个读音,小于1取出第1个,大于该字的读音总数取出失败



由于库数据量庞大,现在处理速度上还是不太理想,处理100个汉字差不多耗时60~110毫秒,用于短文本处理还是足够用了,很长的文本就别想了。速度很慢。

另外,个人力量比较有限,如果你发现了不能取出拼音的中文或多音字还有读错的情况,请在本贴留言。我们一起来完善他。

-----------------------------------------------------------------------------
DLL使用黑月编译,本身仅20K左右,因内置了库的原因,达到155K
-----------------------------------------------------------------------------
PS:有人问我,为什么不发成模块或源码,而是编译成DLL。
原因很简单:源码不想发,模块可以被反编译。虽然没啥技术含量,但是我花了近10天整理的字库 + 多音字库不想让一些小可爱白嫖

特别是一些定制了又消失的小可爱。

下载地址:





作者: 西瓜大大    时间: 昨天 13:36
这是源码区 你发错位置了
https://125.confly.eu.org/forum.php?mod=viewthread&tid=14685429
可以试试这个 空间换时间的索引定位 速度是最快的了 没有之一
作者: 天雨时晴    时间: 昨天 14:49
应该是多音字拖慢了速度
作者: 一指温柔    时间: 昨天 15:40
谢谢楼主分享
作者: 1184798949    时间: 昨天 17:06
感谢分享
作者: 深寒    时间: 昨天 17:11
天雨时晴 发表于 2025-7-2 14:49
应该是多音字拖慢了速度

是的。就是多音字
作者: 乱跑的和风    时间: 昨天 19:18
感谢分享,很给力!~
作者: 笨来无一悟    时间: 昨天 20:22
用映射 提速50倍 问题不大
作者: 汉族    时间: 昨天 20:51
支持一下  
作者: 张张利利    时间: 昨天 21:15
建议作者 把拼音放在汉字的头上  就感觉很专业
作者: tx520    时间: 昨天 23:28
wqeeeeeeeeeeeeeeeeee
作者: 杨明煜    时间: 7 小时前
学习进步!......
作者: 蓝河笑月    时间: 7 小时前
感谢分享
作者: year1970    时间: 7 小时前
感谢分享
作者: 佛学e语言    时间: 7 小时前
谢谢分享
作者: awq130    时间: 6 小时前
真是太神奇了 能转拼命我能理解  能加声调是真的神奇,给作者点赞
作者: 一指温柔    时间: 6 小时前
感谢分享,很给力!~
作者: wh1234567    时间: 5 小时前
感谢分享
作者: nywl2008    时间: 5 小时前
感谢分享




欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4