当前位置: 首页 > news >正文

两学一做党员夜校播放网站引流用什么话术更吸引人

两学一做党员夜校播放网站,引流用什么话术更吸引人,宣城市建设监督管理局网站下载,wordpress实现商城在爬学校安全教育题库的时候发现题库分页实际上执行了一段js代码,如下图所示 点击下一页时是执行了函数doPostBack,查看页面源码如下 点击下一页后这段js提交了一个表单,随后后端返回对应数据,一开始尝试分析获取对应两个参数&a…

在爬学校安全教育题库的时候发现题库分页实际上执行了一段js代码,如下图所示在这里插入图片描述
在这里插入图片描述
点击下一页时是执行了函数doPostBack,查看页面源码如下
在这里插入图片描述
点击下一页后这段js提交了一个表单,随后后端返回对应数据,一开始尝试分析获取对应两个参数,封装在data中通过POST请求获得新的一页,后面尝试了很久始终不成功…(肯定是因为太菜)

没办法只能使用神器selenium,缺点是要调用浏览器,肯定是比较慢的,但是python直接给你模拟浏览器的各种操作,而且不用抓包分析,比较方便。所以还是偷偷懒,注意,除了python要安装selenium之外,还需要安装对应浏览器的web驱动,这里我用的是谷歌浏览器,驱动下载地址:
镜像:https://registry.npmmirror.com/binary.html?path=chromedriver/
如果你谷歌版本新,镜像上可能没有对应版本。
官网:https://sites.google.com/chromium.org/driver/downloads(117以上在这里找:这里~)

下载好后就是正常的爬虫步骤,直接看代码吧:

import docx
from selenium import webdriver
import html2text
import timeidx = [4, 5, 9, 10, 11, 13, 14, 15, 16]
srcsel = 'xxxx/Web/userSingle.aspx?ID='  # 选择题
srcjg = 'xxxx/Web/userIs.aspx?ID='  # 判断题def remove_tags(text):h = html2text.HTML2Text()h.ignore_links = Truereturn h.handle(text)def process(url):driver = webdriver.Chrome()driver.get(url)res = driver.find_element("id", 'GridViewx').get_attribute('innerHTML')res = remove_tags(res)doc.add_paragraph().add_run(res)pages = int(driver.find_element("id", 'GridViewx_ctl13_lblPageCount').text)# pages = 2for i in range(pages - 1):time.sleep(1.5)driver.find_element("id", 'GridViewx_ctl13_btnNext').click()res = driver.find_element("id", 'GridViewx').get_attribute('innerHTML')res = remove_tags(res)doc.add_paragraph().add_run(res)driver.quit()doc = docx.Document('res.docx')
for pid in idx:process(srcsel + str(pid))time.sleep(3)process(srcjg + str(pid))
doc.save('res.docx')

为什么多此一举用html2text呢?因为发现这样写又能比较好看(和丑的比起来)还不用自己一条数据一条数据取出来排版。然后代码里我直接写进word文档里了,这里有个小坑,你的word文档(docx)中必须得有东西,不能是空的,要不然会报错…

懒得排版,凑合看看
http://www.shuangfujiaoyu.com/news/59566.html

相关文章:

  • 手机网站制作时应该注意的问题seo顾问合同
  • 东莞专业网站建站设计seo网址大全
  • 做个商城网站怎么做便宜关键词如何排名在首页
  • 浏览器无法打开住房和建设网站注册域名后怎么建网站
  • 锛网站网站seo外链建设
  • 不会写代码如何做网站廊坊seo排名
  • 精通网站建设100全能建站密码seo服务哪家好
  • 做网站麻烦不提升神马seo关键词自然排名
  • 青岛做网站企业seo什么意思中文意思
  • 做网站seo优化总结抖音seo排名软件
  • 全屏响应式网站模板好看的网站ui
  • 有个人做网站的网站seo内容优化
  • 数码产品商城网站建设广州营销推广
  • 网站设计的任务抖音seo关键词排名技术
  • php网站开发文档网站功能
  • 怎么查网站的浏览量百度搜索平台
  • 合肥专业做淘宝网站网站建设的基本流程
  • 旅游网网站建设方案seo优化工具哪个好
  • 做资讯类网站策划是做什么的
  • 青岛专业做网站的公司有哪些南宁seo
  • 公众号电影网站是怎么做的百度搜一下
  • 做网站累吗seo网站平台
  • 西安公司注册流程潍坊seo计费
  • 重庆学校网站建设郑州网站建设公司排行榜
  • 做网站的问题kol营销模式
  • 橙子建站广告怎么收费提高seo关键词排名
  • 注册公司做网站广告推广语
  • 上海网站seo牛巨微免费正能量erp软件下载
  • 广东汕头潮南区疫情苏州seo免费咨询
  • 哪个网站有教做面食网络营销公司如何建立