//文章采集 //先加载多页 //再采集href里面的网址 //再依次采集里面的标题和内容 //保存utf8文件到`文章`目录 设置_最低版本(200) 浏览器_启动() 浏览器_跳转(`https://m.admin5.com/`) 等待(1000) //先加载10页 计次循环(10) { 浏览器_点击(`[text="加载更多"]`) 等待(500) //适当等待半秒 } //再采集href里面的网址 //全部=浏览器_取元素Text_全部(`[class="moreList"] li a`) //采集标题 全部 = 浏览器_取元素href_全部(`[class="moreList"] li a`) //采集href里面的网址 输出(`全部:` + 全部) //分割成数组格式 数组 = 文本_分割(全部, `\n`) 输出(`数组:` + 数组[0]) 成员数 = 数组_取成员数(数组) 输出(`成员数:` + 成员数) i = 0 计次循环(成员数) { 浏览器_跳转(数组[i]) //每次读取一个成员网址打开 i++ 标题 = 浏览器_取元素Text(`H1`) 标题 = 文本_删除文件名禁用符号(标题) 输出(`标题:` + 标题) 内容 = 浏览器_取元素Text(`[class="ms-content-p"]`) 内容 = 文本_取左边_倒取(内容, `版权声明:`) //后面的版权声明不要 //输出(`内容:` + 内容) 文件_写入_UTF8(`文章/${标题}.txt`, 内容) //保存到`文章`目录 等待(1000) //适当等待1秒 }