|
|
发表于 2014-9-19 17:35:54
|
显示全部楼层
[演示网址][/演示网址]
[升级地址][/升级地址]
[采集来源1]http://pic.women.sohu.com/cate-911273_{页码}.shtml[/采集来源1]--采集多页地址
[采集正则1]<a href="(.*?)" target="_blank">[/采集正则1]
[采集页数]129[/采集页数] --请自行修改要采集的页数
[开始页码]130[/开始页码]
[页码频率]-1[/页码频率]
[采集延时]100[/采集延时]
[采集编码]gbk[/采集编码]
[采集过滤][/采集过滤]
--
[采集库]{采集正则1}[/采集库]
之前的采集错误了,我重新改了下,但改完后的会抓取到少部分的垃圾数据 |
|