Python零成本实现京东商品价格监控+库存预警,自动薅羊毛全攻略
一、引言相信大家都有过这样的经历看中一款心仪已久的商品天天刷京东看价格结果刚买完第二天就降价或者某款热门产品一直缺货好不容易有货了却没抢到白白错过优惠。手动监控不仅费时费力还很容易错过最佳购买时机。作为一个资深薅羊毛爱好者我曾经尝试过各种价格监控工具但要么收费太贵要么有广告要么功能不全。后来我决定自己写一个Python爬虫来实现京东商品的自动价格监控和库存预警。一开始我用requests直接请求接口结果被京东的反爬系统虐得死去活来不仅要破解各种加密参数还动不动就弹出滑块验证码代码写了几百行稳定性却极差。直到我用上了之前分享的Selenium接管已启动浏览器的方法一切问题都迎刃而解。不需要破解任何加密不需要处理验证码代码量减少了80%而且稳定运行了半年多没有被封过。本文将手把手教你从零开始搭建一个属于自己的京东价格监控系统支持多商品同时监控、历史价格记录、降价自动提醒和库存预警全程零成本只要有基本的Python基础就能学会。二、技术选型与整体流程2.1 为什么选择Selenium接管浏览器京东作为国内反爬最严格的电商平台之一其反爬体系非常完善所有接口都有复杂的签名验证频繁请求会触发滑块验证码对自动化工具的检测极其严格价格和库存数据都是动态加载的如果用requests直接请求接口你需要破解sign、token等十多个加密参数而且京东每隔一段时间就会更新加密逻辑代码维护成本极高。而Selenium接管真实浏览器的方法可以绕过所有这些检测网站看到的就是一个真实用户在浏览页面。2.2 整体流程设计是否启动Chrome并开启远程调试Selenium连接浏览器手动登录京东账号加载商品监控列表访问商品页面提取商品价格和库存与历史价格对比满足预警条件?发送邮件/微信预警等待下一次检测2.3 环境准备安装所需的Python库pipinstallselenium4.19.0schedule1.2.1 python-dotenv1.0.1三、核心功能实现3.1 浏览器初始化与登录态保持这是整个系统最关键的部分。我们使用固定的用户数据目录这样只需要手动登录一次京东账号后续所有运行都会自动保持登录状态不需要每次都重新登录。fromseleniumimportwebdriverfromselenium.webdriver.chrome.optionsimportOptionsfromselenium.webdriver.support.uiimportWebDriverWaitfromselenium.webdriver.supportimportexpected_conditionsasECfromselenium.webdriver.common.byimportByimportsubprocessimporttimeimportosclassJdPriceMonitor:def__init__(self):self.port9222self.user_data_dirC:\\jd_monitor_chromeself.driverNonedefstart_chrome(self):启动Chrome并开启远程调试# 关闭所有Chrome进程subprocess.run([taskkill,/f,/im,chrome.exe],capture_outputTrue)time.sleep(1)# 创建用户数据目录ifnotos.path.exists(self.user_data_dir):os.makedirs(self.user_data_dir)# 启动Chromechrome_pathrC:\Program Files\Google\Chrome\Application\chrome.exeargs[chrome_path,f--remote-debugging-port{self.port},f--user-data-dir{self.user_data_dir},--disable-blink-featuresAutomationControlled]subprocess.Popen(args)time.sleep(3)# 连接到Chromechrome_optionsOptions()chrome_options.add_experimental_option(debuggerAddress,f127.0.0.1:{self.port})self.driverwebdriver.Chrome(optionschrome_options)print(浏览器启动成功)# 首次运行需要手动登录self.driver.get(https://passport.jd.com/new/login.aspx)input(请在浏览器中登录京东账号登录完成后按回车键继续...)3.2 商品价格与库存提取京东的商品页面有多种价格显示方式包括京东价、促销价、秒杀价、预售价格等我们需要处理所有这些情况。同时还要检测商品的库存状态区分有货、无货、预约和预售。defget_product_info(self,url):获取商品价格和库存信息try:self.driver.get(url)time.sleep(2)# 提取商品名称nameWebDriverWait(self.driver,10).until(EC.presence_of_element_located((By.CLASS_NAME,sku-name))).text.strip()# 提取价格优先取促销价没有则取京东价priceNoneprice_selectors[.price.J-p-now,# 促销价.price.J-p-ori,# 原价.seckill-price,# 秒杀价.pre-sale-price# 预售价]forselectorinprice_selectors:try:price_elementself.driver.find_element(By.CSS_SELECTOR,selector)price_textprice_element.text.strip()ifprice_textand¥inprice_text:pricefloat(price_text.replace(¥,).replace(,,))breakexcept:continue# 提取库存状态stock_status未知try:stock_elementself.driver.find_element(By.ID,store-prompt)stock_textstock_element.text.strip()if无货instock_textor暂时缺货instock_text:stock_status无货elif有货instock_textor现货instock_text:stock_status有货elif预约instock_text:stock_status预约中elif预售instock_text:stock_status预售中except:# 如果找不到库存元素默认认为有货stock_status有货return{name:name,price:price,stock:stock_status,url:url,time:time.strftime(%Y-%m-%d %H:%M:%S)}exceptExceptionase:print(f获取商品信息失败:{e})returnNone3.3 历史价格记录与预警判断我们将每个商品的历史价格记录在一个字典中每次检测时与历史最低价和用户设定的预警价格进行对比当价格低于预警值或者库存从无货变为有货时触发预警。def__init__(self):# ... 之前的初始化代码 ...self.product_history{}# 商品历史价格记录self.alert_sent{}# 已发送预警的商品避免重复发送defcheck_price_alert(self,product_info,target_price):检查是否满足预警条件urlproduct_info[url]current_priceproduct_info[price]current_stockproduct_info[stock]ifnotcurrent_price:returnFalse# 更新历史价格ifurlnotinself.product_history:self.product_history[url][]self.product_history[url].append({price:current_price,time:product_info[time]})# 计算历史最低价min_pricemin([p[price]forpinself.product_history[url]])# 预警条件价格低于目标价 或者 库存从无货变为有货should_alertFalsealert_messageifcurrent_pricetarget_price:should_alertTruealert_messagef【降价提醒】{product_info[name]}\n当前价格¥{current_price}\n目标价格¥{target_price}\n历史最低价¥{min_price}\n商品链接{url}ifcurrent_stock有货andurlinself.alert_sentandself.alert_sent[url].get(stock)无货:should_alertTruealert_messagef【库存提醒】{product_info[name]}\n现在有货了\n当前价格¥{current_price}\n商品链接{url}# 更新预警状态ifshould_alert:self.alert_sent[url]{price:current_price,stock:current_stock,time:time.time()}print(alert_message)returnalert_message# 更新库存状态ifurlnotinself.alert_sent:self.alert_sent[url]{}self.alert_sent[url][stock]current_stockreturnFalse四、预警机制实现4.1 邮件预警邮件预警是最简单、最通用的预警方式不需要任何第三方服务只需要一个邮箱账号即可。这里以QQ邮箱为例importsmtplibfromemail.mime.textimportMIMETextfromemail.headerimportHeaderdefsend_email_alert(receiver_email,message):发送邮件预警# 邮箱配置sender_email你的QQ邮箱qq.comsender_password你的QQ邮箱授权码# 注意这里是授权码不是邮箱密码smtp_serversmtp.qq.comsmtp_port465# 构造邮件msgMIMEText(message,plain,utf-8)msg[From]Header(f京东价格监控 {sender_email},utf-8)msg[To]Header(receiver_email,utf-8)msg[Subject]Header(京东商品价格变动提醒,utf-8)# 发送邮件try:serversmtplib.SMTP_SSL(smtp_server,smtp_port)server.login(sender_email,sender_password)server.sendmail(sender_email,receiver_email,msg.as_string())server.quit()print(邮件发送成功)returnTrueexceptExceptionase:print(f邮件发送失败:{e})returnFalse4.2 微信企业号预警如果你想在微信上直接收到提醒可以使用微信企业号的应用消息功能。注册一个个人企业号是完全免费的而且没有发送次数限制。五、定时任务与多商品监控使用schedule库实现定时任务可以轻松设置每30分钟或每小时检测一次价格。同时支持多个商品同时监控只需要把商品信息添加到监控列表中即可。importscheduledefmonitor_job(monitor,products):监控任务print(f\n开始检测时间{time.strftime(%Y-%m-%d %H:%M:%S)})forproductinproducts:urlproduct[url]target_priceproduct[target_price]print(f正在检测{url})product_infomonitor.get_product_info(url)ifproduct_info:print(f商品名称{product_info[name]})print(f当前价格¥{product_info[price]})print(f库存状态{product_info[stock]})alert_messagemonitor.check_price_alert(product_info,target_price)ifalert_message:send_email_alert(你的邮箱example.com,alert_message)time.sleep(random.uniform(5,10))# 随机延迟避免被检测if__name____main__:# 要监控的商品列表products_to_monitor[{url:https://item.jd.com/100012345678.html,target_price:2999},{url:https://item.jd.com/100087654321.html,target_price:199}]# 初始化监控器monitorJdPriceMonitor()monitor.start_chrome()# 设置定时任务每30分钟检测一次schedule.every(30).minutes.do(monitor_job,monitor,products_to_monitor)print(价格监控系统已启动按CtrlC退出)try:whileTrue:schedule.run_pending()time.sleep(1)exceptKeyboardInterrupt:print(\n正在退出...)monitor.driver.quit()subprocess.run([taskkill,/f,/im,chrome.exe],capture_outputTrue)print(监控系统已关闭)六、实战技巧与注意事项检测频率设置不要设置得太频繁建议至少15分钟一次否则容易被京东限制。对于价格变动不频繁的商品每小时检测一次就足够了。登录态保持使用固定的user-data-dir登录一次后可以保持几个月的登录状态。如果登录态失效重新手动登录一次即可。元素选择器更新京东偶尔会更新页面结构如果发现提取不到价格或库存用开发者工具重新查找对应的元素选择器即可。多账号轮换如果需要监控大量商品可以准备多个京东账号轮换使用降低被检测的风险。异常处理添加完善的异常处理机制当网络异常或页面加载失败时自动重试而不是直接崩溃。七、总结本文实现了一个功能完整的京东商品价格监控系统使用Selenium接管真实浏览器的方法绕过了京东的反爬检测代码简单易懂维护成本极低。你可以根据自己的需求扩展更多功能比如支持天猫、淘宝等其他电商平台添加历史价格走势图实现降价自动下单支持短信、钉钉等更多预警方式最后提醒大家本工具仅供个人学习和使用请遵守京东的用户协议和相关法律法规不要用于商业用途或大规模爬取数据。合理使用这个工具可以帮你省下不少钱再也不会错过任何优惠活动。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2510114.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!