精简代码优化效率!!!实测取3698条数据从4s+ 减少到700ms
多线程继续优化!!!!!群友实测25+线程同时工作CPU占用10%
多线程请编译运行!!!多线程请编译运行!!!多线程请编译运行!!!(重要的事情说三遍)
增加了几个判断,没有数据直接返回,防止没有数据或者解析失败的情况下CPU占用过多
命令更改:从初始化_解析文本()改为解析html文本
命令更改:从表达式_置表达式解析解析取结果改为解析取结果
命令更改:从表达式_自动初始化表达式解析改为临时解析
类名称从 类_HZKpath 改回 HZKpath 并且以后不在变动(为方便输入)
解析表达式结构时判断引号!!!支持单引号、双引号和没有引号
增加新条件比较符号:不包含!<>
增加标签:css选择器语法支持,语法为//css[],具体请看手册
增加变量:%hhf%换行符,可用在文本中,具体请看手册
增加变量:%t[]t%文本转义,用于当文本中有表达式分隔符时正确识别文本,,具体请看手册
增加判断属性是否存在功能,用法是//a[@href],作用是取出存在href属性的a标签
增加特殊属性:@@html,取出此标签html代码,可以后面加属性表达式进行条件比较或者取出结果使用,也可写为@@outerhtml,具体请看手册
增加特殊属性:@@innerhtml,取出不包含此标签的内部html代码
增加特殊属性:@@textcontent,取出内部文本,与@@text结果一致,待测试
增加强制取属性值的功能,用法@@@+标签名,如@@@width,用于取出无法取出的属性值,原理是模块内加了正则表达式进行文本解析,具体请看手册
调整属性表达式的目的:对取出文本进行修改
属性表达式可以用于尾部对取出的属性进行文本处理,具体请看手册
属性表达式可以多个使用,用,分割,具体请看手册
增加属性表达式:删首尾空 %sswk%,具体请看手册
增加属性表达式:正则表达式,%re[正则表达式]re% ,具体请看手册
增加属性表达式:删除文本 %del[删除内容]del%,具体请看手册
增加属性表达式:取出格式化文本 %f[文本前缀%text%文本后缀]f%,具体请看手册
增加属性表达式:嵌套表达式`%path[hzkpath表达式]path%,可以对取出的文本进行表达式再次解析,可以用于同时取出多个不同级别标签下的不同属性,取出第一个寻找到的结果,具体请看手册
增加属性表达式:替换文本%th[被替换文本,替换文本]th%,可以对取出的文本进行文本替换,具体请看手册
增加属性表达式:取某文本中间%mid[文本前缀,文本后缀,是否从两头寻找]mid%,对取出的文本取出前后缀中间的东西,具体请看手册
增加属性表达式:加文本前后缀%add[文本前缀,文本后缀]add%,对取出的文本增加前缀和后缀,具体请看手册
注意:此版本保留了之前版本的{%num%}取整数的功能,取出指定格式文本请使用%f[%text%]f%
修复空表达式会导致数组溢出的BUG
修复条件 or(数字) 这种格式的条件,可以同时取出指定位置的标签,具体请看手册
增加条件负数整数,取出倒数的标签,如//a[-1]取出倒数第一个a标签
增加连续整数条件,可以是正数或者负数,//a[2~6]取出第2到第6个a标签,//a[3~-2]取出第3到倒数第2个a标签
当整数条件不写条件类型时,为取出前一个条件结果中的第几个标签,写条件类型时为所有标签的第几个标签,具体请看手册
修复了属性表达式返回的结果包含条件时,没有指定字符的结果的BUG
公开模块内的HZK文本模块的代码,可以调用,跟精
易语言不同,此套文本指令按字符数量工作而不是文本实际长度