当前位置: 首页 > news >正文

做网站版头图片seo网站推广经理招聘

做网站版头图片,seo网站推广经理招聘,java手机网站建设,帮传销组织做网站一、目的 在用Flume采集Kafka中的数据写入HDFS后,发现写入HDFS的不是每天一个文件,而是一个文件夹,里面有很多小文件,浪费namenode的宝贵资源 二、Flume的配置文件优化(参考了其他博文) (一&a…

一、目的

在用Flume采集Kafka中的数据写入HDFS后,发现写入HDFS的不是每天一个文件,而是一个文件夹,里面有很多小文件,浪费namenode的宝贵资源

二、Flume的配置文件优化(参考了其他博文

(一)方法一、大多数人推荐经过测试有效的方法

在Flume任务的配置文件设置

a1.sinks.k1.hdfs.rollSize = 0  
a1.sinks.k1.hdfs.rollCount = 0  

而不是

a1.sinks.k1.hdfs.round=true

a1.sinks.k1.hdfs.roundValue=10

a1.sinks.k1.hdfs.roundUnit=minute

将rollSize和rollCount设置为0,表示不根据临时文件大小和event数量来滚动文件(滚动文件即指将HDFS上生成的以.tmp结尾的临时文件转换为实际存储文件

还有说可以调大rollSize的参数,比如调至102400,表示100KB。滚动文件的单位是byte。

(二)方法二、有人推荐经过测试后似乎有效的方法

还是在Flume任务的配置文件设置

a1.sinks.k1.hdfs.minBlockReplicas=1

我测试过,本来每5分钟就会有104.54 KB和1.63 KB的两个文件,因为有两个数据源。

在配置文件里加入这个a1.sinks.k1.hdfs.minBlockReplicas=1后,那个小文件1.63 KB就消失了。

所以这个方法还是有效的,但是对我来说就有点问题,就把它给去掉了,还是用方法一

Flume虽然安装简单,但是使用起来却非常不简单,使用过程中需要优化的配置服务很多,需要进一步研究总结!

http://www.shuangfujiaoyu.com/news/30601.html

相关文章:

  • 网站访问量大网络运营培训
  • wordpress单栏极简深圳seo优化方案
  • 外国网站域名在哪查表白网站制作
  • 沈阳网站建培训机构专业
  • 网站建设部门宣言网络营销在哪里学比较靠谱
  • 达川网站制作百度收录情况
  • 商务网站建设策划书安全优化大师
  • 手机网站被做跳转宣传方式有哪些
  • 软件做网站刘雯每日资讯
  • dreamweaver cs6教程网站建设seo优化培训
  • 辽宁大连网站建设软文广告怎么写
  • 网站支付接口如何做搜索引擎关键词优化技巧
  • 网站的报价怎么做搜外网友情链接
  • 广州论坛网站seo 培训教程
  • 帮别人做非法网站自首百度推广费用怎么算
  • 拼团网站开发新手做seo怎么做
  • wordpress 增加小工具seo教程 百度网盘
  • wordpress里面的副标题啥意思seo网站优化快速排名软件
  • 不同类型网站优化短视频营销推广方案
  • 上海人才网积分查询东莞百度快照优化排名
  • 做美缝在哪个网站接单国外免费源码共享网站
  • 建设网站需要哪个软件seo优化策略
  • 万能浏览器appseo百度贴吧
  • 网站开发技术 javaseo云优化如何
  • 网页设计与网站建设步骤媒体宣传推广方案
  • 做网站首页郑州百度seo排名公司
  • 科技网站设计淘宝网页版
  • 什么网站可以做拍a发布会淘宝指数官网的网址
  • 网站怎么制作百度安装
  • 在建设一个公司网站多少钱东莞营销型网站建设