Big_Data大数据环境

准备wsl2 docker

设置docker 源或者使用代理

 "registry-mirrors": [
    "https://hub-mirror.c.163.com",
    "https://mirror.baidubce.com"
  ]

打开2375 端口

Expose daemon on tcp://localhost:2375 without TLS

安装 hadoop+spark+hive

找到项目

git clone https://github.com/Marcel-Jan/docker-hadoop-spark.git

## 进入执行docker命令 等待下载完毕
docker-compose up -d

docker中

Quick Start HDFS

把本地的测试文件复制到docker中

example.txt

hello world hello china 
hello laihong
good morning

复制

docker cp /mnt/d/ProgramSoft/BIG_DATA/docker-hadoop-spark/example.txt namenode:exampl
e.txt

进入docker

  docker exec -it namenode bash

创建hdfs文件夹

hdfs dfs -mkdir -p /data/openbeer/breweries

复制金hdfs中,并查看

 hdfs dfs -put example.txt /data/openbeer/breweries/example.txt
 hdfs dfs -ls  /data/openbeer/breweries/

测试

使用hadoop自带测试jar

wordcount 测试

指定jar 以及输入，输入，输出路径

hadoop jar /opt/hadoop-3.2.1/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.1.jar wordcount /data/openbeer/breweries/example.txt /data/openbeer/breweries/out

查看结果

hdfs dfs -ls /data/openbeer/breweries/out

hdfs dfs -cat /data/openbeer/breweries/out/part-r-00000

结果如下

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
assets		assets
.gitignore		.gitignore
HIVE.md		HIVE.md
README.md		README.md
docker安装hadoop-sprak-hive.md		docker安装hadoop-sprak-hive.md
大数据环境.md		大数据环境.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Big_Data大数据环境

准备wsl2 docker

安装 hadoop+spark+hive

Quick Start HDFS

测试

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

Big_Data大数据环境

准备wsl2 docker

安装 hadoop+spark+hive

Quick Start HDFS

测试

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Packages