|
|
本帖最后由 qswa123qswa 于 2018-9-23 17:37 编辑
规则1:
[采集来源1]http://my.liebiao.com/post/index?source=display_post[/采集来源1]
[采集正则1]<a href="(.*?)" class="list-1" title=[/采集正则1]
[采集页数]1[/采集页数] --请自行修改要采集的页数
[开始页码]1[/开始页码]
[页码频率]1[/页码频率]
[采集延时]100[/采集延时]
[采集编码]utf8[/采集编码]
[保存顺序]0[/保存顺序]
[采集替换][/采集替换]
---------------------------------------------
[采集库]{帐号}|{密码}|{采集正则1}|{采集正则2}[/采集库]
================================================
规则:2
[采集来源1]http://my.liebiao.com/post/index?source=display_post[/采集来源1]
[采集正则1]<p>信息编号:(.*?) \| 2018-06-[/采集正则1]
[采集页数]1[/采集页数] --请自行修改要采集的页数
[开始页码]1[/开始页码]
[页码频率]1[/页码频率]
[采集延时]100[/采集延时]
[采集编码]utf8[/采集编码]
[保存顺序]0[/保存顺序]
[采集替换][/采集替换]
---------------------------------------------
[采集库]{帐号}|{密码}|{采集正则1}|{采集正则2}[/采集库]
==============================================
合并后:
[采集来源1]http://my.liebiao.com/post/index?source=display_post[/采集来源1]
[采集正则1]<a href="(.*?)" class="list-1" title=[/采集正则1]
[采集来源2]http://my.liebiao.com/post/index?source=display_post[/采集来源2]
[采集正则2]<p>信息编号:(.*?) \| 2018-06-[/采集正则2]
[采集页数]1[/采集页数] --请自行修改要采集的页数
[开始页码]1[/开始页码]
[页码频率]1[/页码频率]
[采集延时]100[/采集延时]
[采集编码]utf8[/采集编码]
[保存顺序]0[/保存顺序]
[采集替换][/采集替换]
---------------------------------------------
[采集库]{帐号}|{密码}|{采集正则1}|{采集正则2}[/采集库]
这样合并后,采集结果里面没有数据,同一个采集来源网址,要获取里面两个地方,然后合并,这个要怎样正确的合并
还有以下要怎样获取
<p>信息编号:471040059 | 2018-06-09 00:37</p>
<p class="cut">
<a class="list-2">
复制被隐藏显示不出来,看图片
要正则获取471010059 跟 chengde 然后时间要选择 6月份整个月的
[采集来源1]http://my.liebiao.com/post/index?source=display_post[/采集来源1]
[采集正则1][/采集正则1]
[采集页数]1[/采集页数] --请自行修改要采集的页数
[开始页码]1[/开始页码]
[页码频率]1[/页码频率]
[采集延时]100[/采集延时]
[采集编码]utf8[/采集编码]
[保存顺序]0[/保存顺序]
[采集替换][/采集替换]
---------------------------------------------
[采集库]{帐号}|{密码}|{采集正则1}|{采集正则2}[/采集库]
|
|