精易论坛

标题: 取网页中所有链接,正则怎么写? [打印本页]

作者: sjfpchome    时间: 2016-1-7 16:32
标题: 取网页中所有链接,正则怎么写?
各位大侠,用 精易模块 批量取以下的 绿色底子部分内容:地址、标题、未读、时间。或者只取“未读”内容的。正则如何写??

以下为源码:

          <li><a href="content.htm?id=160104191015496240963&sid=&page=1">
                 <div class="left_img"><img src="http://61.178.14.114:81/front/images/default.jpg" /></div>
                 <div class="text_qishu">【教学风采】“走新”的课堂教学”更要“走心”<div class="ydt">(已读)</div></div>
                 <div class="datetime">2016-01-04</div></a>
            </li>
            <div class="DL_line" style="clear:both"></div>
         
            <li><a href="content.htm?id=160104190918587240961&sid=&page=1">
                 <div class="left_img"><img src="http://61.178.14.114:81/front/images/default.jpg" /></div>
                 <div class="text_qishu">【教育资讯】王嘉毅在文县开展“双联”和教育精准扶贫工作<div class="wdt">(未读)</div></div>
                 <div class="datetime">2016-01-04</div></a>
            </li>
            <div class="DL_line" style="clear:both"></div>
         
            <li><a href="content.htm?id=160104190858276240954&sid=&page=1">
                 <div class="left_img"><img src="http://61.178.14.114:81/front/images/default.jpg" /></div>
                 <div class="text_qishu">【人文素养】巴西电影《中央车站》的人物赏析<div class="wdt">(未读)</div></div>
                 <div class="datetime">2016-01-04</div></a>
            </li>
            <div class="DL_line" style="clear:both"></div>
         
            <li><a href="content.htm?id=160104190805844240949&sid=&page=1">
                 <div class="left_img"><img src="http://61.178.14.114:81/front/images/default.jpg" /></div>
                 <div class="text_qishu">最美乡村教师 —— 王丽英<div class="ydt">(已读)</div></div>
                 <div class="datetime">2016-01-04</div></a>
            </li>
-------------------------------------------------------------------------------------------------------------

并且是“每页20条记录”

<div class="yema">
  每页20条记录,当前第1/28页&nbsp;&nbsp;&nbsp;
           <a href="#*">上一页</a><a href="#*">下一页</a>
           &nbsp;&nbsp;&nbsp;&nbsp;转到&nbsp;
           <input type="text" name="number" style="width:40px; height:24px"/>
           &nbsp;页</span>
         </div>
-----------------------------------------------------------------------------------------------------------

作者: 每天学一点    时间: 2016-1-7 16:39
匹配链接地址
------------------------------------------------
href *= *['"]*(\S+)["']

评注:匹配网页上的链接地址  如有帮助 望采纳
作者: 无夜    时间: 2016-1-7 16:39
你这个比较有规律,比较简单吧
作者: Yillsen    时间: 2016-1-7 16:46
采纳吧! 这个.zip (162.11 KB, 下载次数: 17)




作者: 戒卜掉思恋    时间: 2016-1-7 17:25
href *= *['"]*(\S+)["']

QQ截图20160107172513.png (53.51 KB, 下载次数: 0)

QQ截图20160107172513.png





欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4