文章_zzjmay_极客社区

zzjmay

https://i.ancii.com/zzjmay/

zzjmay

zzjmay zzjmay

文章

HDFS

hdfs dfs -put [-f] [-p] [-l] <本地路径> <目标路径>hdfs dfs -put /opt/a.txt /usr/root//txtdir. 本人已经设置了环境变量，则可以在任意的路径下可直接使用hdf

zzjmay 0喜欢 / 0评论 2020-07-04

Hadoop之hadoop fs和hdfs dfs、hdfs fs三者区别

tackoverflow的解释Hadoop fs：使用面最广，可以操作任何文件系统。hadoop dfs与hdfs dfs：只能操作HDFS文件系统相关，前者已经Deprecated，一般使用后者。Following are the three comma

zzjmay 0喜欢 / 0评论 2020-06-08

flume

Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。a)Source：采集组件，用于跟数据源对接，以获取数据。c)Channel：传输通道组件，用于从source将数据传递到sink. #因为要存到hdfs上，所以下沉组件位hdfs.

zzjmay 0喜欢 / 0评论 2020-06-07

公司测试环境namenode修复过程

公司测试环境的namenode出现损坏启动不了。一开始是因为把机器的dfs目录改成了权限777，后来百度了下发现755才可以。修改完发现namenode启动过程一直报edits文件里面存在文件丢失。修改过程还遇到hdfs一直处于安全模式问题，但是想leav

zzjmay 0喜欢 / 0评论 2020-05-17

Hive架构

前面我们讲解了hive是什么，下面我们接着来看一下hive的架构。在讲解hive的架构前，我们先看一下hadoop的生态系统图，看一下hive到底在hadoop生态系统中占据着什么位置。将物理的计划提交给yarn进行执行。我们来解释下什么是元数据。这些就组

zzjmay 0喜欢 / 0评论 2020-05-17

HDFS优缺点及改进策略

目前在实际应用中，HDFS已经能用来存储管理PB级的数据了。　　2）流式的访问数据　　HDFS的设计建立在更多地响应"一次写入、多次读写"任务的基础上。这就要求设计HDFS时要充分考虑数据的可靠性，安全性及高可用性。HDFS是为了处理大

zzjmay 0喜欢 / 0评论 2020-05-06

Windows 上运行 Hadoop WordCount 用例

This script is Deprecated. Instead use start-dfs.cmd and start-yarn.cmd. 创建hdfs 目录，如果刚打开是 safe mode 还不能创建目录，那么可以关掉safe mode 就可以了

zzjmay 0喜欢 / 0评论 2020-04-23

HDFS常用命令总结

zzjmay 0喜欢 / 0评论 2020-04-09

Hadoop——MapReduce介绍

MapReduce是一种编程模型，用于大规模数据集的并行运算。概念"Map（映射）"和"Reduce（归约）"，是它们的主要思想。　　首先2T的文件，你放在单机上可能存不下来，如果再他多一点呢？比如几千个文件，几十个

zzjmay 0喜欢 / 0评论 2020-02-23

Hadoop命令 hadoop fs

命令的基本格式：。在HDFS的文件系统中，HDFS只支持绝对路径。查看根目录下面的所有文件和文件夹。在HDFS文件系统的根路径下创建test1.txt的文件

zzjmay 0喜欢 / 0评论 2020-02-21

hdfs datanode decomission引发的block missing

确认了下线步骤没有问题以后，选择原来的datanode继续decomission，但是这一步会一直卡住，不会完成，看了下datanode的日志，确实是在移动数据，但是看节点的io很小，完全达不到正常下线节点时的io。于是我把datanode停了，通过cdh

zzjmay 0喜欢 / 0评论 2020-02-20

HDFS命令行操作和 api操作

HDFS，是Hadoop Distributed File System的简称，是Hadoop抽象文件系统的一种实现。Hadoop抽象文件系统可以与本地系统、Amazon S3等集成，甚至可以通过Web协议来操作。HDFS的文件分布在集群机器上，同时提供副

zzjmay 0喜欢 / 0评论 2020-01-17

hive

hive是基于hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类sql的查询功能。)row format delimited fields terminated by ‘ ‘;load data inpath ‘hdfs路径

zzjmay 0喜欢 / 0评论 2020-01-11

02 HDFS 分布式环境实战

4)修改完成后，记得 source /etc/profile使配置生效。4) 拷贝整个hadoop安装目录到其他机器

zzjmay 0喜欢 / 0评论 2020-01-01

【大数据面试宝典】第二篇 HDFS 面试题

1）客户端通过Distributed FileSystem模块向NameNode请求上传文件，NameNode检查目标文件是否已存在，父目录是否存在。4）NameNode返回3个DataNode节点，分别为dn1、dn2、dn3。5）客户端通过FSData

zzjmay 0喜欢 / 0评论 2020-01-08

HDFS架构

　　　　1.存储文件和目录的元数据：包含文件的block的副本个数，修改和访问的时间，访问权限，block大小以及block列表信息。　　　　3.fsimage文件不记录每个block所在的datanode信息，这些信息会在每次系统启动的时候从datano

zzjmay 0喜欢 / 0评论 2019-12-27

大数据（2）---HDFS集群搭建

　　1.准备几台机器，我这里使用VMware准备了四台机器，一个name node，三个data node。　　2.Hadoop生态几乎都是用的java开发的，因此四台机器还需要安装JDK。　　3.集群内主机域名映射，将四台机器的IP和主机名映射分别写到h

zzjmay 0喜欢 / 0评论 2019-12-24

HDFS概述（一）

随着数据量越来越大，在一个操作系统存不下所有的数据，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，迫切需要一种系统来管理多台机器上的文件，这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。HDFS的使用场景：适合一次写入，多

zzjmay 0喜欢 / 0评论 2019-10-25

HDFS的一致性分析

在分析HDFS的一致性之前, 我们先得解决HDFS客户端行为的几个问题。首先谈一谈HDFS产生的历史。HDFS是根据Google的GFS论文所实现的, 初期时它的主要设计目标是为了存储MapReduce所操作的大型数据集。一般情况下, 各个reducer的

zzjmay 0喜欢 / 0评论 2019-01-06

学习笔记 Hadoop组成详解

本节和大家学习一下Hadoop方面的知识，内容主要有Hadoop概念介绍和Hadoop组成，希望通过本节的学习大家对Hadoop有初步的了解，下面让我们一起来学习Hadoop吧。其实，Hadoop并不仅仅是一个用于存储的分布式文件系统，而是设计用来在由通用

zzjmay 0喜欢 / 0评论 2010-06-03

加载中...

zzjmay

0 关注 0 粉丝 0 动态