文章_whulovely_极客社区

whulovely

https://i.ancii.com/whulovely/

whulovely

whulovely whulovely

文章

Flume浅度学习指南

Flume is a distributed, reliable, and available service for efficiently collecting, aggregating, and moving large amounts of log

whulovely 0喜欢 / 0评论 2019-11-19

菜鸟的Hadoop快速入门

大数据是一门概念，也是一门技术，是以Hadoop为代表的大数据平台框架上进行各种数据分析的技术。大数据包括了以Hadoop和Spark为代表的基础大数据框架，还包括实时数据处理，离线数据处理，数据分析，数据挖掘和用机器算法进行预测分析等技术。Hadoop是

whulovely 0喜欢 / 0评论 2019-09-07

mapreduce连接不上hdfs

很奇诡啊的问题，所有配置没问题，问题出现在ipv6上，

whulovely 0喜欢 / 0评论 2019-09-07

golang整洁之道（一）

设计工整的go项目配置文件问题背景项目经常会涉及到配置文件，而配置文件往往包含多方的配置信息，可能同时涉及到MySQL，kafka，hive，hdfs等等。不加思索的yaml配置文件最快，最直接的方案自然是如下示例，直接写yaml部分。用代码实现需求通常不

whulovely 0喜欢 / 0评论 2019-07-01

浅谈Hadoop

运行于廉价的商用机器集群上：HDFS设计时充分考虑了可靠性、安全性及高可用性，因此Hadoop对硬件要求比较低，可以运行于廉价的商用机器集群，无需昂贵的高可用性机器。这些datanode的信息在Hadoop启动时，会缓存到namenode中。

whulovely 0喜欢 / 0评论 2016-10-28

应用AI芯片加速 Hadoop 3.0 纠删码的计算性能

本文由云+社区发表做为大数据生态系统中最重要的底层存储文件系统HDFS，为了保证系统的可靠性，HDFS通过多副本的冗余来防止数据的丢失。通常，HDFS中每一份数据都设置两个副本，这也使得存储利用率仅为1/3，每TB数据都需要占用3TB的存储空间。因此，在保

whulovely 0喜欢 / 0评论 2019-06-30

HDFS fs命令

[root@centos local]# start-all.sh查看进程 [root@centos local]# jps. drwxr-xr-x - root supergroup 0 2015-05-19 11:08 /usr更

whulovely 0喜欢 / 0评论 2015-05-20

HDFS Quotas[官网整理]

HDFS允许管理员对各个目录设定文件的个数或者空间使用总量。其中“name quotas”和“space quotas”可以分别设定。Name Quota是一个硬性限制，用来控制目录下文件或者子目录的个数。目录重命名不会改变原有的quotas，如果操作导致

whulovely 0喜欢 / 0评论 2014-08-18

HDFS常用命令[备忘]

3) ./hdfs dfs -appendToFile - /hdfs/data/txt，这个命令执行之后，允许在窗体中输入字符串，Ctrl + C退出stdin，此后stdin数据将会追加到hdfs文件中。注意，当前用户必须是文件的owner或者为sup

whulovely 0喜欢 / 0评论 2014-08-06

Hadoop 管理

|--fstimeVERSION文件时一个Java属性文件，其中包含正在运行的HDFS版本信息。----layoutVersion是一个负数，描述HDFS永久性数据结构的版本，这个版本号与Hadoop发布包的版本号无关。只要布局更新，版本号便会递减，HDF

whulovely 0喜欢 / 0评论 2014-04-04

精通hadoop

简单地说来，Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。这些服务器群总计可达数千个节点。3高效率：通过分发数据，hadoop可以在数据所在的节点上并行地处理它们，这使得处理非常的快速。4可靠性：hadoop能自动地维护数据的多份复制，并

whulovely 0喜欢 / 0评论 2013-10-22

hadoop的超时设置

最近在测试mysql往HDFS备份的性能问题，发现对mysql执行xtrabackup进行限速之后经常出现HDFS写入不正常的情况。对应在hbase中的默认值如下：。// Timeouts for communicating with DataNode f

whulovely 0喜欢 / 0评论 2013-06-23

Hadoop学习十一：Hadoop-Hdfs RPC总结

我曾经写过一篇文章容器学习一：HashMap源码分析，后来有网友对我说，全文不介绍HashMap怎么使用，只介绍了源码，有点孤立。到昨天又有网友对我说，看了你的分析RPC的三篇文章，并没有理解RPC到底是个什么玩意，给我留下的影响只有Java反射。这个就是

whulovely 0喜欢 / 0评论 2013-05-25

ERROR org.apache.hadoop.hdfs.server.namenode.NameNode: java.io.IOException: Inco

在安装单机hadoop1.0.3时，namenode一直安装不上。通过hostname命令，查看当前主机名为CentOS-6.3。c. hostname CentOS63使主机名立即生效。最好，之后先退出终端，再进行单机hadoop的操作。

whulovely 0喜欢 / 0评论 2012-10-05

高可用的HDFS学习笔记1

高可用的HDFS 写道对于HDFS来说，每一份数据可以有多个副本，因此文件数据的可靠性由副本来解决。然而，对于元数据管理来说，只有一个节点NameNode,它的好坏直接道决定了HDFS能否正常服务，因此NameNode的高可用性决定了整个HDFS系统的高可

whulovely 0喜欢 / 0评论 2012-08-14

2018年第34周-hive数据迁移（同步）

背景存在某种情况，HIVE数据可能要从一个HDFS中，传到另一个hdfs中。可以说是迁移，也可能是数据同步。STORED AS ORC;c_date字段是年月日yyyyMMdd，也就是按天分区。

whulovely 0喜欢 / 0评论 2019-06-28

Hadoop管理-集群维护

$ hadoop fsck / -files -blocks -locations -racks 4) 运行fsck的时机，建议使用定时任务,并把结果发送给管理员。$ hadoop dfsadmin -report 3)重新加载dfs.hosts及df

whulovely 0喜欢 / 0评论 2012-07-03

大数据项目实践（一）——之HDFS集群配置

192.168.10.131 bigdata-pro01.mars.com bigdata-pro01关闭防火墙。rpm -e --nodeps [jdk进程名称1 jdk进程名称2]root用户下设置无密码用户切换。ssh-copy-id bigdata

whulovely 0喜欢 / 0评论 2019-06-28

HDFS 架构指南

它与现有的分布式文件系统有很多相似之处。然而，从其他的分布式文件系统的差异是显着的。HDFS是高容错和被设计为低成本硬件上部署。HDFS的应用数据提供高吞吐量的访问，是适用于具有大型数据集的应用程序。HDFS的满足一些POSIX的要求，流式方式访问文件系统

whulovely 0喜欢 / 0评论 2012-05-27

2018年第23周-大数据的HDFS数据流及操作例子

上周已经把Hadoop的HDFS的架构和设计大概说了下，也有部署过程。在这周讲的HDFS的数据流及操作例子。在客户端写入数据时，DFSOutputStream将它分成一个个的数据包，并写入内部队列，称为“数据队列”。DataStreamer处理数据队列，它

whulovely 0喜欢 / 0评论 2019-06-27

加载中...

whulovely

0 关注 0 粉丝 0 动态