当前位置: 首页 > news >正文

广州品牌网站设计公司seo定义

广州品牌网站设计公司,seo定义,做微信平台网站,沈阳网站建站公司爬取猪八戒网站数据:2024-12-12 使用xpath解析元素,安装依赖库 pip install lxml使用selenium步骤我的上篇博客有提到,这里就不重复了 selenium使用博客导航 # 安装pip install lxml,使用xpath from lxml import etree import time from s…

爬取猪八戒网站数据:2024-12-12

使用xpath解析元素,安装依赖库

pip install lxml

使用selenium步骤我的上篇博客有提到,这里就不重复了
selenium使用博客导航

# 安装pip install lxml,使用xpath
from lxml import etree
import time
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options# 设置Chrome选项
chrome_options = Options()
chrome_options.add_argument("--headless")  # 无头模式,不打开浏览器窗口
chrome_options.add_argument("--disable-gpu")
chrome_options.add_argument("--no-sandbox")# 设置ChromeDriver路径
service = Service('D:\\env\\python3\\chromedriver.exe')
keyword = "微信小程序"
url = f"https://www.zbj.com/fw/?k={keyword}"
# 初始化WebDriver
driver = webdriver.Chrome(service=service, options=chrome_options)
driver.get(url)
# 等待页面加载
time.sleep(2)  # 等待内容加载html = driver.page_source # 原页面
# 使用xpath提取元素
tree = etree.HTML(html)
divList = tree.xpath("/html/body/div[2]/div/div/div[3]/div[1]/div[4]/div/div[2]/div[1]/div[2]/div")
for divItem in divList:price_elements = divItem.xpath("./div/div[3]/div[1]/span/text()")title_elements = divItem.xpath("./div/div[3]/div[2]/a/span/text()")company_elements = divItem.xpath("./div/div[5]/div/div/div/text()")sales_elements = divItem.xpath("./div/div[3]/div[3]/div[1]/div/span[2]/text()")good_elements = divItem.xpath("./div/div[3]/div[3]/div[2]/div/span[2]/text()")price = price_elements[0].strip("¥") if price_elements else "N/A"title = keyword.join(title_elements) if title_elements else "N/A"company = company_elements[0] if company_elements else "N/A"sales = sales_elements[0] if sales_elements else "N/A"good = good_elements[0] if good_elements else "N/A"print(f"价格: {price}")print(f"标题: {title}")print(f"商铺名: {company}")print(f"销量: {sales}")print(f"好评: {good}")print("下一家***********************")
driver.quit()  # 关闭浏览器

运行效果:
在这里插入图片描述
在这里插入图片描述
猪八戒网每次请求的数据都会随机打乱,所以控制台输出的顺序可能与页面的对应不上。
通过keyword变量可以更换查询内容。可以试试其他关键字。。。

http://www.shuangfujiaoyu.com/news/51151.html

相关文章:

  • 做个营销型网站多少钱爱站网长尾关键词挖掘查询工具
  • 做网站可以用php吗上海seo推广方法
  • 金普新区城乡建设局网站上海百度推广电话
  • 在线阅读小说网站怎么做现在做推广的新渠道有哪些
  • 网站设计美工多少关键词在线听
  • 网站建设内容论文seo怎么优化武汉厂商
  • 乌海网站建设最新全国疫情消息
  • 日本做攻略国内交通网站怎样弄一个自己的平台
  • 免费网站建设公司代理北京疫情消息1小时前
  • 北京公司网站优化百度营业执照怎么办理
  • 做贷超网站 前期需要什么分析企业短视频推广
  • 做视频网站靠什么赚钱营销软文范例500
  • 传奇简单网站模板百度关键词排名点击
  • 创建免费网站注意事项百度搜索浏览器
  • 建盏大师排名表2020杭州seo培训
  • 网站建设实训意义微博seo营销
  • 小程序做跳转微网站海外短视频跨境电商平台是真的吗
  • 结合公众号小店做网站如皋网站制作
  • 怎么做监测网站的浏览量今天有哪些新闻
  • 江门当地的免费网站优化文明seo
  • 网站制作优质公司青岛谷歌优化公司
  • 湘潭网站建设 磐石网络在哪产品推广策划方案怎么做
  • 大连专业模板网站制作网络营销策划方案
  • 政府网站建设情况介绍企业网站制作公司
  • 建设一个购物网站多少钱网站推广工具有哪些
  • 网站备案查询验证码错误淘宝自动推广软件
  • 深圳网站制作网络建设公司南京seo域名
  • h5网站开发流程图seo简单优化
  • 网站后台发表文章seo教程seo官网优化详细方法
  • 昆明做网站那家好个人在线网站推广