当前位置: 首页 > news >正文

网站vip功能怎么实现网站设计公司怎么样

网站vip功能怎么实现,网站设计公司怎么样,flash asp设计公司网站源码,网站开发流程视频上一节我们对爬虫程序的默认回调函数parse做了改写,提取的数据可以在Scrapy的日志中打印出来了,光打印肯定是不行的,还需要把数据存储,数据可以存到文件,也可以存到数据库,我们一一来看。 存储数据到文件 首先我们看看如何将数据存储到文件,在讲[[【Scrapy】Scrapy教程…

上一节我们对爬虫程序的默认回调函数parse做了改写,提取的数据可以在Scrapy的日志中打印出来了,光打印肯定是不行的,还需要把数据存储,数据可以存到文件,也可以存到数据库,我们一一来看。

存储数据到文件

首先我们看看如何将数据存储到文件,在讲[[【Scrapy】Scrapy教程5——第一个Scrapy项目]]时,我们改写了prase函数,将首页存储到了一个shouye.html文件中,这便是我们的简单的数据存储,但这个存储方式是我们纯手写的代码,存的是整个页面,并非我们想要的数据。
这节主要讲存储数据,我们看下通过Scrapy命令直接存储数据,在这之前我们将parse函数修改下。

def parse(self, response):# 从获取的所有文章中提取链接和标题for article in response.css(".card")[1:]:yield {"title": article.xpath("./a").css("span::text").get(),"link": self.start_urls[0] + article.xpath("./a/@href").get(),}

然后,我们在到命令行中,运行以下命令。

scrapy crawl shouye -o titles.json

上面这条命令会将我们提取的数据存储到titles.json文件中,存储后的效果如下图所示。
在这里插入图片描述

我们会发现,存储的数据没有错,但是被整体存到了一个大的字典中,这不是我想要的结果,我只要数据一行一行的存储下来就好了,我们可以用以下命令。

scrapy crawl shouye -o titles.jsonl

没错,我们换个存储格式,就可以了。
在这里插入图片描述

存储数据到数据库

上面这种方法存储简单的数据可以,对于复杂结构的数据存储,就要引入Items和pipelines了。

Items

我们爬取页面的目标就是将非结构化数据提取为结构化数据,而Item就是Scrapy提供的一个类,用于定义通用输出数据格式的。Scrapy可以将提取的数据,作为Item返回,类似python的键值对。

Item Types

Scrapy通过itemadapter支持字典、Item对象、数据类对象、attrs对象几种Item类型。

  • 字典:类似Python的键值对字典
  • Item对象:Item提供的一个类似dict的API,可以支持更高级的特性
  • dataclass对象:允许定义具有字段名称的项目类,可以指定字段的类型和元数据
  • attrs对象:允许定义具有字段名称的项目类,可以指定字段的类型和元数据
http://www.shuangfujiaoyu.com/news/32406.html

相关文章:

  • 无锡cms建站搜索引擎营销的主要模式
  • 武汉做网站哪家专业百度推广在线客服
  • 邢台网站制作哪家强网站seo搜索引擎的原理是什么
  • 品牌网站建设报价单seo排名工具给您好的建议
  • 做网站容易学吗线上线下推广方案
  • 长沙 网站开发无代码建站
  • 易优cms和织梦cms的区别搜索网站排名优化
  • wordpress积分与奖励页面关键词优化
  • 能带描文本外链的网站seo学习论坛
  • 香港主机做擦边球网站西安seo服务公司
  • 无锡网站建设无锡网络推广深圳百度关键
  • 昆明免费网站建设天天网站
  • 怎样免费自己做网站视频百度公司电话热线电话
  • 人才招聘网站怎么做百度添加到桌面
  • ps做网站小红书关键词搜索量查询
  • dw一个完整网页的代码seo怎么读
  • 可以下载电影的网站怎么做厦门网站关键词推广
  • html5 图片展示网站新闻发布系统
  • 网站首页被降权怎么做网络营销经典成功案例
  • 网站软件下载安装免费版网络营销渠道可分为哪些
  • 深圳的网站建设十堰seo优化
  • 合肥 网站建设最好看免费观看高清视频了
  • 免费网站建设教程seo外链发布
  • 汕头有建网站公司吗引流推广广告怎么写
  • 邯郸网站建设的地方公司推广渠道
  • 大型网站技术架构营销网站建设哪家好
  • 用div css做网站首页公众号推广方法
  • 教师可以做网站吗域名ip查询入口
  • 宿迁做网站哪家好最新重大新闻
  • 企业做网站建设遇到的问题苏州百度推广排名优化