Skip to content

Mengta666/python_spider

Repository files navigation

这是一个python 爬虫仓库

learn中是静态页面爬虫,例如requests库等操作

selenium中是动态页面爬虫,包含了如何过验证码检测等代码,里面 CalculateDistance.py 包含了一个自动检测滑动验证码区域的类,可以直接使用,可以看我的另一个仓库,有深度学习预测滑块验证码位置

小项目中有各种各样的项目,监控脚本、下载脚本等等

2025年12月20日更新:提交知乎爬虫项目,包含cookie获取和定时任务刷cookie

详细查看: 项目目录

2025年5月30日更新:LowEndTalk优惠信息监控

  1. 新做了一个LowEndTalk优惠信息监控网站爬虫,接入telegram机器人,当该网站每一天有新的offer时,会自动通过脚本发送给telegram机器人
  2. 该脚本每半小时爬取一次网站(通过cron定时任务,你可以修改定时)。

安装方式

  1. 将LowEndTalk目录下的所有内容克隆到你的服务器的 /opt/LowEndTalk/ 文件夹下, mkdir -p /opt/LowEndTalk/ ,你也可以自定义,你需要修改所有的绝对路径为你的自定义目录(别修改文件名);
  2. 去 env/LowEndTalk 中配置机器人 Tokenchat_id(必须);
  3. 添加可执行权限 chmod +x 1_LowEndTalk.sh;
  4. 当前目录下运行 1_LowEndTalk.sh ,将进行全自动安装(你也可以手动安装):bash 1_LowEndTalk.sh;
  5. 再运行 2_cron_lowendtalk.sh ,你可以直接获取到当天截止到目前的所有offer信息 bash 2_cron_lowendtalk.sh;
  6. 完毕

预览: Screenshot 20250530 182659

注:没有做python3-venv判断,假如因为python3-venv安装失败,根据提示安装python3-venv即可,例Debian/Ubuntu:apt-get install python3-venv


有什么好的项目可以联系我邮箱,有时间我会考虑开发:mengta6664@gmail.com

About

Python爬虫项目

Resources

Stars

Watchers

Forks

Packages

 
 
 

Contributors