- 积分
- 887
- 注册时间
- 2011-4-1
- 激情
- 428
- 居住地
- 中国 内蒙古自治区 锡林郭勒盟 锡林浩特市
- 在线时间
- 1476 小时
- 最佳答案
- 0

用户组:VIP终身会员
   
|
楼主 |
发表于 2017-5-10 12:45:56
|
显示全部楼层
--采集规则
[采集来源1]https://s.taobao.com/search?q={词库1}&sort=sale-desc&bcoffset=0&p4ppushleft=%2C44&s={页码}[/采集来源1]
[采集正则1]"nid":"(.*?)",[/采集正则1]
[采集页数]5[/采集页数] --请自行修改要采集的页数
[开始页码]0[/开始页码]
[页码频率]44[/页码频率]
[采集延时]100[/采集延时]
[采集编码]utf8[/采集编码]
[保存顺序]0[/保存顺序]
[采集替换][/采集替换]
[采集库]C:\{时间=月}-{时间=日}-{时间=时}{词库1}.txt===:https://detail.tmall.com/item.htm?id={采集正则1}[/采集库]
这样子可以保存出来,但是保存结果有问题!!
还有个小问题,{词库1} 可以单独转码么!!因为是搜索的不单独编码,无法准确查到到相对应的产品。。 |
|