文章_Sweeneyzuo_极客社区

Sweeneyzuo

https://i.ancii.com/sweeneyzuo/

Sweeneyzuo

Sweeneyzuo sweeneyzuo

文章

常用大数据组件

1、实时 flume--> kafka--》storm--》hdfs

Sweeneyzuo 0喜欢 / 0评论 2018-09-08

Logstash安装部署配置

为了实现各业务平台日志信息采集到大数据平台hdfs上。之前的定技术栈是flume->kafka->storm->hdfs.其中通过storm需要写代码，稳定性，可扩展性，维护性不好。现请部署到生产环境。zk_connect=>&qu

Sweeneyzuo 0喜欢 / 0评论 2017-04-28

hadoop map join 思路待补充

.map端join适用场景：小表可以全部读取放到内存中。在一个TaskTracker中可以运行多个map任务。每个map运行时只需要从linux磁盘加载数据就行了，不必每次从HDFS加载。

Sweeneyzuo 0喜欢 / 0评论 2014-12-11

InputFormat简析

hadoop把处理的文件读取到并解析成键值对，这个操作是通过InputFormat类的子类实现的。切分好后形成一系列的map reduce任务，taskertracker通过心跳机制和jobtracker定期交互，告诉jobtracker其资源使用情况，m

Sweeneyzuo 0喜欢 / 0评论 2014-11-30

Sqoop详解

通常一个组织中有价值的数据都要存储在关系型数据库系统中。但是为了进一步进行处理，有些数据需要抽取出来，通过MapReduce程序进行再次加工。为了能够和HDFS系统之外的数据库系统机型交互，MapReduce程序需要使用外部API来访问数据。Sqoop就是

Sweeneyzuo 0喜欢 / 0评论 2014-11-19

hadoop 学习要点

（二）HDFS命令行接口。（四）文件读取和文件写入，一致性。（五）集群数据的均衡。（七）NameNode单点故障问题。（八）大量小文件处理策略。（九）数据备份和恢复。（十二）安装新节点。（十三）卸载节点。（十五）HDFS格式化过程。（十七）当前单NameN

Sweeneyzuo 0喜欢 / 0评论 2013-11-08

第七章：小朱笔记hadoop之源码分析-hdfs分析第四节：namenode-HeartbeatMonitor

DataNode节点在注册时候就开始定期向NameNode节点发送心跳包，以此来告知 NameNode节点自己当前还是可用的，同时从NameNode节点那里得到对自己的控制命令并执行。然而，当一个 DataNode节点没有按时向NameNode节点发送心跳

Sweeneyzuo 0喜欢 / 0评论 2013-05-21

自开发跨HDFS版本的拷贝工具

虽然HDFS提供了distcp的远程拷贝工具，在同版本之间拷贝很方便，功能也很强大。另外，HDFS也专门为跨版本提供了hftp协议，提供只读功能，但是该功能也有个致命缺陷，即需要配置被拷贝集群的所有节点的hosts，因为这个协议走的是HDFS的web管理接

Sweeneyzuo 0喜欢 / 0评论 2013-05-15

单独启动datanode和tasktracker遇到的小问题

在测试集群上拉了5台机器，自己另外搭建了一个小集群，不影响原来的集群。该处涉及到三个属性值，

Sweeneyzuo 0喜欢 / 0评论 2012-05-28

hadoop hdfs的一些用法

Example 3-1. Displaying files from a Hadoop filesystem on standard output using a

Sweeneyzuo 0喜欢 / 0评论 2011-07-04

Mahout 结果目录详解

运行官网上的mahoutkmeas示例，结果文件夹有clusteredPoints，clusters-N，data，用命令mahout seqdumper仔细看了一下结果文件。clusters-N：是第N次聚类的结果，其中n为某类的样本数目，c为各类各属性

Sweeneyzuo 0喜欢 / 0评论 2018-07-11

Kafka对Java程序员有多重要？连阿里都在用它处理亿万级数据统计

一．了解淘宝Kafka架构在ActiveMQ、RabbitMQ、RocketMQ、Kafka消息中间件之间，我们为什么要选择Kafka?下面详细介绍一下，2012年9月份我在支付宝做余额宝研发，2013年6月支付宝正式推出余额宝，2013年8月担任支付宝淘

Sweeneyzuo 0喜欢 / 0评论 2019-02-15

那些零基础学习大数据技术的人后来怎么样了？

纵观近几年的互联网发展趋势，看到大数据被炒得火热，也想要涉足大数据领域，学习一些大数据技术，但奈何自己目前是零基础，能学会大数据技术吗？大数据培训课程好学吗？这个一是看自己选择的培训机构，再就是看自己的学习能力和感兴趣程度了，个人感受，自从在千锋学习大数据

Sweeneyzuo 0喜欢 / 0评论 2018-10-10

基于HBase的海量微博数据高效存储解析

通过分析HBase的特点，提出了一种基于HBase的海量微博数据高效存储方案。该方案通过建立合适的数据存储模型、预建Region，提出行关键字生成规则和跳过坏记录的方法，使得数据能够利用MapReduce模型高效且不间断地导入HBase数据库。实验结果表明

Sweeneyzuo 0喜欢 / 0评论 2015-05-13

加载中...

Sweeneyzuo

0 关注 0 粉丝 0 动态