精易论坛

标题: 正则表达式的问题 [打印本页]

作者: qq52280449    时间: 2022-7-8 18:46
标题: 正则表达式的问题

第一个问题 :第一行html后面 多余的代码   利用正则可以去掉吗   
第二个问题 :所有的匹配到的子文本  都不是完整的超链接  这个是因为源代码就不是完整的   正则是否有命令符可以给他补全”https:”这个头

查阅了一些资料也没查到  

作者: 企鹅号525150138    时间: 2022-7-8 18:46
href="(.*?)\?(?:showid|spm)
作者: qq52280449    时间: 2022-7-8 18:48
上传附件 txt文本 说不合法....

作者: 周sir    时间: 2022-7-8 19:22
正则改成   herf="(.*?).html   ,就没有后边的东西了

没有前边的http,自己补全就可以了
“https:”+正则.取子匹配文本()+.html

作者: 企鹅号525150138    时间: 2022-7-8 19:26
正则.创建 (“href=” + #引号 + “(.*?)\?(?:showid|spm)”, 子文本替换 (#常量1, #引号 + “//v.youku.com”, #引号 + “https://v.youku.com”, , , 真))
作者: Siempre    时间: 2022-7-8 19:43
href="(.*?)\.html     用这个表达式 匹配出来的结果+“.html”
作者: qq52280449    时间: 2022-7-8 22:20
企鹅号525150138 发表于 2022-7-8 19:23
href="(.*?)\?(?:showid|spm)

新技能学习了
作者: qq52280449    时间: 2022-7-8 22:21
Siempre 发表于 2022-7-8 19:43
href="(.*?)\.html     用这个表达式 匹配出来的结果+“.html”

是个好办法




欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4