精易论坛

标题: 看似简单实则非常复杂的递归分割文本算法,有兴趣的可以看看 [打印本页]

作者: ds9660    时间: 2014-12-17 21:34
标题: 看似简单实则非常复杂的递归分割文本算法,有兴趣的可以看看
本帖最后由 ds9660 于 2014-12-17 21:36 编辑

最近做到一个项目,需要分析一些网站的title,大家知道,网站的标题每个人的写法不同。

有的人喜欢以,分割,有的人喜欢以 | 分割,什么样的都有,那问题就来了,怎么样写一个方法,可以批量分割这样的文本呢?

喜欢思考的可以先自己尝试对这段文本进行分割,然后再看我的源码。

工具,支持库,素材|下载专区-VC、VB、C#、汇编/学习区



如果有大牛能发现更好更快的算法,请私信发一份源码给我学习,谢谢。

就算不加分,点一下赞也好啊!{:soso_e102:}

作者: 笑红尘゛    时间: 2014-12-17 21:36
正则
作者: 寻找星空    时间: 2014-12-17 21:36
沙发。                             
作者: 宇轩一号    时间: 2014-12-17 22:16
分割文本,这个命令都能把我搞死,先分割换行符,在分割符号,有时候还会超出下标,真是无奈。
作者: 用爱来证明    时间: 2014-12-17 22:27
提示: 作者被禁止或删除 内容自动屏蔽
作者: chq0428    时间: 2014-12-17 22:35
谢谢分享了
作者: xsd    时间: 2014-12-17 22:56
学习一下!!分割文本这个命令绕死我

作者: statmu    时间: 2014-12-17 23:29
就算不加分,点一下赞也好啊
作者: boxxie    时间: 2014-12-17 23:39
好像很强大哟
作者: wjj281005321    时间: 2014-12-17 23:51
秒杀隐藏帖..但还是希望楼主多发精品好帖啦.....
作者: 等到烟火清凉    时间: 2014-12-18 00:39
一般都用正则,这个看看,学习学习

作者: xiaojiakm    时间: 2014-12-18 02:04
思路不错,赞一下

作者: niming    时间: 2014-12-18 06:49
分割文本,这个命令都能把我搞死,先分割换行符,在分割符号,有时候还会超出下标,真是无奈。

作者: 一切重新开始    时间: 2014-12-18 09:01
#在这里快速回复#,这个命令都能把我搞死
作者: heize    时间: 2014-12-18 10:16
不错,看看咋写的。

作者: zzzzzzzz88    时间: 2014-12-18 11:32
看一下思路!!
作者: wjd    时间: 2014-12-18 11:32
学习学习.......
作者: qq1348    时间: 2014-12-18 12:23
不错!!!!!!!!!
作者: 新魅岁月    时间: 2014-12-18 12:27
谢谢分享!
作者: 2540225359    时间: 2014-12-18 12:52
谢谢分享  学习学习下 ..........

作者: 堕天圣黑猫    时间: 2014-12-18 14:20
额。。。。拿走了。。。→_→
作者: EExiaolin    时间: 2014-12-18 14:26
那么问题来了,

作者: 腾龙跃然    时间: 2014-12-18 14:26

作者: hljmake    时间: 2014-12-18 14:42
挺给力的啊
作者: 薛柬    时间: 2014-12-18 19:26
觉得好,我就赞!谢谢开源!

作者: 229158    时间: 2014-12-18 19:32
提示: 作者被禁止或删除 内容自动屏蔽
作者: myxf    时间: 2014-12-18 19:57
先替换,再分割?
作者: 半夏时光八    时间: 2014-12-18 21:19
以前就被这个困扰过。。。一直没找到

作者: Mr.Yang    时间: 2014-12-18 21:46
必须看看是什么
作者: U小愚    时间: 2014-12-18 22:12
支持开源,看下学习
作者: 网络注册会员    时间: 2014-12-19 08:00
支持一下好强啊
作者: 网络注册会员    时间: 2014-12-19 08:00
再顶一下算法
作者: 小爬虫    时间: 2014-12-19 10:59
不错不错,下载学习了
作者: 清風小軒    时间: 2014-12-19 11:46
支持开源~!感谢分享
作者: 流星雨    时间: 2014-12-19 11:58
不错不错,下载学习

作者: ghtyn1000    时间: 2014-12-19 17:23
深层次学习再学习
作者: 2838036369    时间: 2014-12-19 18:09
看起来很棒,支持楼主
作者: DF-Sky    时间: 2014-12-19 22:41
学习一下!!!!
作者: 2236051301    时间: 2014-12-20 13:22
谢谢分享,谢谢

作者: yinghao2005    时间: 2014-12-20 13:30
支持开源~!感谢分享
作者: KEY心碎    时间: 2014-12-20 14:36
这个正需要
作者: bindit    时间: 2014-12-20 16:12
这个是好玩具,下载用用,辛苦了!
作者: wkf    时间: 2014-12-20 16:24
非文字的拿来做分割
作者: Alexander——    时间: 2014-12-20 17:53
看看啊!!!!!!
作者: 哈哈哈871108    时间: 2014-12-20 23:09
学习了,嘎嘎


作者: 我很天真    时间: 2014-12-20 23:57
来下载啦{:soso_e102:}

作者: XBy    时间: 2014-12-21 01:49
学习下。。。。

作者: 宇轩一号    时间: 2014-12-21 02:13
分割文本,又是这个,我用的是分割字节集。
作者: hnhyqqk    时间: 2014-12-21 04:09
是个什么东东  没看明白
作者: hnhyqqk    时间: 2014-12-21 04:10
没有看明白,可能我还要多学习
作者: 人辞    时间: 2014-12-21 09:05
回复,看隐藏,
作者: 1182733571    时间: 2014-12-21 09:11
支持开源~!感谢分享
作者: ferline8    时间: 2014-12-21 11:26
矮油、、非常感谢楼主的分享!支持...
作者: 浮云游子    时间: 2014-12-21 11:38
看看         

作者: 我是你亲表哥    时间: 2014-12-21 14:13
直接(.+?)[,\|、]+正则不就好了?
作者: 34670176    时间: 2014-12-21 14:17
我是你亲表哥 发表于 2014-12-21 14:13
直接(.+?)[,\|、]+正则不就好了?

(.+?)[,\|、-]+  确实是
作者: NeverLoveAgain    时间: 2014-12-21 18:38
精华哦!!  
作者: so888    时间: 2014-12-21 21:20
简简单单的先收藏了.
作者: 饭没了秀    时间: 2014-12-21 22:45
可能思路不一样喔
作者: 小贤饼饼    时间: 2014-12-21 22:50
这样的好东西,肯定要支持

作者: jing9393    时间: 2014-12-21 23:17
谢谢分享,支持
作者: a395944065    时间: 2014-12-21 23:57
拿下学习····················

作者: 379061296    时间: 2014-12-22 00:34
感谢分享              
作者: qq420345437    时间: 2014-12-22 04:17
支持开源~!感谢分享
作者: 三一在线    时间: 2014-12-22 10:13
了解一下,

作者: yaojinlun001    时间: 2014-12-22 12:38
看看怎么样,试用下


作者: wuts2003    时间: 2014-12-22 13:30
支持开源~!感谢分享
作者: wfg6273677    时间: 2014-12-22 15:00
学习一下!!!!!!!

作者: 沐紫萌    时间: 2014-12-22 15:22
学了了  谢谢分享
作者: wdwlrz    时间: 2014-12-22 17:11
#在这里快速回复#支持开源~!感谢分享
作者: 风中冰雨    时间: 2014-12-22 17:40
先一想简单,在细想复杂了

作者: 山药    时间: 2014-12-22 19:31
喜欢给力·············
作者: 我翔飞    时间: 2014-12-22 20:36
支持开源~!感谢分享
作者: Onsxsen    时间: 2014-12-22 23:56
纳尼?貌似很给力的样子
作者: conguers    时间: 2014-12-23 07:38
看看如何啊

作者: zspokzy    时间: 2014-12-23 09:13
好东西,先谢了!!!!!!!!!!!!!!!!

作者: vlouse    时间: 2014-12-23 09:20
嘿嘿,不错,鼎力支持你!!...
作者: 柒月之梦    时间: 2014-12-23 09:21

学习下分割
作者: zspokzy    时间: 2014-12-23 09:37
支持开源~!感谢分享
作者: bs80119514    时间: 2014-12-23 09:44
先替换要分割的分隔符 然后在分割
你这个..
作者: waweiggfnh    时间: 2014-12-23 13:12
不错,支持开源
作者: 暗鹰    时间: 2014-12-23 13:47
顶一下。。。。。。。。。。。

作者: zhuhai82475    时间: 2014-12-23 15:18
支持,支持,支持,支持
作者: dwffxs    时间: 2014-12-23 16:51
好东西。可以学习下!!!!1!!
作者: appleqc    时间: 2014-12-23 18:06
好像很厉害的样子啊。。。。。学习学习
作者: 旧城心失守    时间: 2014-12-23 18:52
纳尼?貌似很给力的样子!!...
作者: harvin    时间: 2014-12-24 00:07
好好学习一下。
作者: 悟空科技    时间: 2014-12-24 12:58
支持开源~!感谢分享
作者: 悟空科技    时间: 2014-12-24 13:05
  
子程序名返回值类型公开备 注
文本分割算法  
参数名类 型参考可空数组备 注
C_文本文本型
变量名类 型静态数组备 注
J_分隔符S文本型6
n整数型 
J_文本文本型 
J_分隔符S = { “,”, “|”, “-”, “_”, “、”, “/” }
J_文本 = C_文本
计次循环首 (取数组成员数 (J_分隔符S), n)
J_文本 = 子文本替换 (J_文本, J_分隔符S [n], “分隔”, , , )
计次循环尾 ()
调试输出 (分割文本 (J_文本, “分隔”, ))


i支持库列表   支持库注释   
spec特殊功能支持库


作者: Violation    时间: 2014-12-24 14:03
额 这不是分割么
作者: 木水云梦    时间: 2014-12-24 14:06
来学习一下啊
作者: xzl001    时间: 2014-12-24 14:35
对新手来说很有用的
作者: 无欲    时间: 2014-12-24 15:25
这个要看看!{:soso_e102:}

作者: 凌哥    时间: 2014-12-24 16:14
很复杂么...
作者: stillness    时间: 2014-12-24 17:14
本帖最后由 Modify 于 2014-12-24 17:17 编辑

递归吃内存 再者文本分割的算法 可以不使用递归。
再者E语言所提供的"寻找文本(InStr)"性能比较低下
需要性能自己重写"InStr"函数。

作者: 温xun    时间: 2014-12-24 18:47
过来支持一下!!!
作者: fwdjl    时间: 2014-12-25 09:22
牛,干的漂亮,以前怎么没注意这方面呢
作者: 宇智波·佐助    时间: 2014-12-25 23:42
木水云梦 发表于 2014-12-24 14:06
来学习一下啊

头像好科幻      
作者: 沼泽潜水    时间: 2014-12-26 04:02
来学习一下
作者: yeayee    时间: 2014-12-26 12:44
过来支持一下!!!




欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4