当前位置: 首页 > news >正文

中国疫情防控现状网站推广优化的方法

中国疫情防控现状,网站推广优化的方法,东莞在哪里学网站建设,两学一做微网站交流一、bg 可以在关系型数据库和hdfs、hive、hbase之间导数 导入:从RDBMS到hdfs、hive、hbase 导出:相反 sqoop1 和sqoop2 (1.99.x)不兼容,sqoop2 并没有生产的稳定版本, Sqoop1 import原理(导入) 从传统数据库获取元数据信息&…

一、bg

可以在关系型数据库和hdfs、hive、hbase之间导数
导入:从RDBMS到hdfs、hive、hbase
导出:相反

sqoop1 和sqoop2 (1.99.x)不兼容,sqoop2 并没有生产的稳定版本,

Sqoop1 import原理(导入)
从传统数据库获取元数据信息(schema、table、field、field type),把导入功能转换为只有Map的Mapreduce作业,在Mapreduce中有很多map,每个map读取一片数据,进而并行的完成数据的拷贝

Sqoop1 export原理(导出):
获取导出表的schema、metahdfs信息,和Hadoop中的字段match;多个map only作业同时进行,完成hdfs中数据导出到关系型数据库

主要是对mapreduce自带的inputformat和outputformat进行了定制

二、下安验配

依赖java和hadoop

三、sqoop使用

1 常用命令

列出数据库的databases

在这里插入图片描述

2 导入

–delete-target-dir :导入到hdfs前,是否删除目录(否则无法覆盖),在生产上不用,手动删

全部导入

查询导入

https://blog.csdn.net/u011250186/article/details/119280478

$CONDITIONS:query设置sql来指定查询条件,并且还需在sql中添加$CONDITIONS,来实现并行运行mr的功能

  • $CONDITIONS是个linux变量,用来给不同的map指定查询范围
  • $CONDITIONS,在查询导入的时候必须加,用来保证两边的数据顺序一致。即使只有一个map
  • 不加会报错
  • 双引号包括的查询sql中,$CONDITIONS要转义
  • 如果是多个m,需使用–split-by来区分数据,$CONDITIONS替换查询范围,

列导入

关键字导入

通过表和列的正则来选定导入的列

3 并行度

在这里插入图片描述
如果-m>1,会自动识别主键并按主键拆分,如果主键不均匀,建议执行拆分列

4 note

‘\N’:单引号’ '原样显示里边的内容=>\N ,sqoop的底层是java代码,java中\会转义为\,即最后会显示为\N。

Hive中的Null在底层是以“\N”来存储,而MySQL中的Null在底层就是Null,为了保证数据两端的一致性。在导出数据时采用–input-null-string和–input-null-non-string两个参数。导入数据时采用–null-string和–null-non-string。

四、面试题

sqoop查询导入时,如果设置了并行度,那如何保证写入到hive的数据跟源表的数据顺序是一样的。$CONDITIONS是用来干嘛的?

sqoop并行读取时,需要指定每个mapper读取的数据范围,保证写入到目的地时有序,$CONDITIONS是个linux变量,用来根据分区列来给每个mapper拼接sql。
默认用主键,如果主键分布不均匀,建议用 --split-by指定分区列。
如果没有主键也没有–split-by,会报错。除非–num-mappers 1 or --autoreset-to-one-mapper 。–autoreset-to-one-mapper用来配合import-all-tables 工具一起使用,以自动处理架构中没有主键的表。

–split-limit参数有什么用

用来限制每个mapper读取数据的大小。如果参数大小 大于 mapper数量决定的数据大小,那会增加mapper数量。
如果设置为0 or negative,则不会生效。

http://www.shuangfujiaoyu.com/news/60918.html

相关文章:

  • 青岛网站建设公搜索引擎网站排名优化方案
  • 网站建设86215百度一下百度搜索网站
  • 青岛企业网站seo技巧云南今日头条新闻
  • 做国际网站有补贴吗网站优化公司大家好
  • 网站后台添加不了图片免费建立自己的网站
  • 专业番禺网站建设奶茶店营销软文
  • 做效果图的兼职网站广告优化师前景怎样
  • 网站做支付宝花呗分期网站推广策略有哪些
  • 泸州做网站的公司济南seo整站优化价格
  • 怎么让同一个局域网上的计算机看到我做的网站路由优化大师
  • 电子商务毕业设计网站建设百度一下你就知道主页
  • 做暖暖视频免费视频老司机网站内部优化
  • web网站如何用div做日历网络推广的主要工作内容
  • 网站建设公司讯息单词优化和整站优化
  • 哪些网站教做生物实验百度云官方网站
  • 珠海建设网站的公司百度竞价电话
  • 网站备案大概多久和生活爱辽宁免费下载安装
  • 汕头企业自助建站系统站长工具在线平台
  • 做360网站优化快速排宣传推广方案
  • 网站流量是怎么赚钱的百度网盘电脑版登录入口
  • 龙岗做网站的公司微信小程序开发平台
  • 中国建设教育协会是个什么网站软文写作范文500字
  • 建设银行网站看不到e商上海网络推广招聘
  • wordpress 移动端不显示seo查询排名系统
  • 网站的服务内容邯郸网站优化
  • 网站定制公司推荐搜索引擎的关键词优化
  • 昌都市网站建设线上平台怎么推广
  • 广东品牌网站建设968百度客服人工电话24小时
  • 沧州网站推广北京官网seo收费
  • app网站下载免费优化关键词的方法包括