learn中是静态页面爬虫,例如requests库等操作
selenium中是动态页面爬虫,包含了如何过验证码检测等代码,里面 CalculateDistance.py 包含了一个自动检测滑动验证码区域的类,可以直接使用,可以看我的另一个仓库,有深度学习预测滑块验证码位置
小项目中有各种各样的项目,监控脚本、下载脚本等等
详细查看: 项目目录
- 新做了一个LowEndTalk优惠信息监控网站爬虫,接入telegram机器人,当该网站每一天有新的offer时,会自动通过脚本发送给telegram机器人
- 该脚本每半小时爬取一次网站(通过cron定时任务,你可以修改定时)。
- 将LowEndTalk目录下的所有内容克隆到你的服务器的 /opt/LowEndTalk/ 文件夹下,
mkdir -p /opt/LowEndTalk/,你也可以自定义,你需要修改所有的绝对路径为你的自定义目录(别修改文件名); - 去 env/LowEndTalk 中配置机器人 Token 和 chat_id(必须);
- 添加可执行权限
chmod +x 1_LowEndTalk.sh; - 当前目录下运行 1_LowEndTalk.sh ,将进行全自动安装(你也可以手动安装):
bash 1_LowEndTalk.sh; - 再运行 2_cron_lowendtalk.sh ,你可以直接获取到当天截止到目前的所有offer信息
bash 2_cron_lowendtalk.sh; - 完毕
注:没有做python3-venv判断,假如因为python3-venv安装失败,根据提示安装python3-venv即可,例Debian/Ubuntu:apt-get install python3-venv
