当前位置: 首页 > news >正文

汉南做网站seo关键词推广渠道

汉南做网站,seo关键词推广渠道,做网站服务器价格多少合适,加微信群网站怎么做的&&大数据学习&& 🔥系列专栏: 👑哲学语录: 承认自己的无知,乃是开启智慧的大门 💖如果觉得博主的文章还不错的话,请点赞👍收藏⭐️留言📝支持一下博主哦&#x1f91…

&&大数据学习&&

🔥系列专栏: 👑哲学语录: 承认自己的无知,乃是开启智慧的大门
💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞


1)Spark on Hive
Spark on Hive 是Hive只作为存储角色,Spark负责sql解析优化,执行。这里可以理解为Spark 通过Spark SQL 使用Hive 语句操作Hive表 ,底层运行的还是 Spark RDD。具体步骤如下:

通过SparkSQL,加载Hive的配置文件,获取到Hive的元数据信息;
获取到Hive的元数据信息之后可以拿到Hive表的数据;
通过SparkSQL来操作Hive表中的数据。

2)Hive on Spark
Hive on Spark是Hive既作为存储又负责sql的解析优化,Spark负责执行。这里Hive的执行引擎变成了Spark,不再是MR,这个要实现比Spark on Hive麻烦很多, 必须重新编译你的spark和导入jar包,不过目前大部分使用的确实是spark on hive。

Hive默认使用MapReduce作为执行引擎,即Hive on MapReduce。实际上,Hive还可以使用Tez和Spark作为其执行引擎,分别为Hive on Tez和Hive on Spark。由于MapReduce中间计算均需要写入磁盘,而Spark是放在内存中,所以总体来讲Spark比MapReduce快很多。因此,Hive on Spark也会比Hive on MapReduce快。由于Hive on MapReduce的缺陷,所以企业里基本上很少使用了。

Spark on Hive和Hive on Spark的区别主要体现在以下三个方面:

  1. 数据源:Spark on Hive的数据源是Hive,它从Hive中获取数据,然后对数据进行SparkSQL操作。而Hive on Spark的数据源是Hive本身。
  2. 执行引擎:Spark on Hive底层运行的还是Spark RDD。而Hive on Spark则是将Hive查询从MapReduce操作替换为Spark RDD操作。
  3. 实现方式:Spark on Hive通过SparkSQL加载Hive的配置文件,获取Hive的元数据信息,然后就可以获取Hive的所有表的数据,并对其进行SparkSQL操作。而Hive on Spark则需要重新编译Spark和导入jar包才能实现。
http://www.shuangfujiaoyu.com/news/43367.html

相关文章:

  • 建一个营销网站的步骤智能搜索引擎
  • 推广之家官网seo快速排名软件网址
  • 2015做导航网站有哪些功能app开发需要哪些技术
  • 公司网站制作哪家公司好怎么做百度推广平台
  • 浙江建设厅继续教育网站首页青岛网络工程优化
  • 哪个网站可以做司考题搜索引擎的营销方法有哪些
  • 中企动力做的网站怎么样刚刚发生了一件大事
  • 建公司网站高德北斗导航
  • 做暧暧视频免费网站免费个人网站制作
  • discuz做淘客网站免费网页模板网站
  • 红古微信网站建设黄山网络推广公司
  • 大疆网站建设百度seo新规则
  • wordpress 导航移动建站优化
  • 兖州做网站百度信息流是什么
  • 温州网站建设小程序长沙百度网站排名优化
  • 分栏型网站网站统计器
  • 国际摄影网站全网营销推广是什么
  • 网站文章发布营销软文推广平台
  • 做试卷的网站百度大数据官网入口
  • markdown直接做网站北京软件培训机构前十名
  • 做网站卖东西seo优化一般包括哪些内容
  • 泰安手机网站建设品牌网络推广方案
  • 网站服务器机房seo国外英文论坛
  • 江苏住房城乡建设厅网站网站建成后应该如何推广
  • wordpress08影院重庆快速排名优化
  • 河北网站备案多久常德今日头条新闻
  • 网站qq客服您需要添加对方好友网站优化种类
  • 全网拓客appseo合作代理
  • 免费网站源码...网络推广网络营销软件
  • 网站内容与功能模块设计网页浏览器