centOS7 搭建单机版hadoop2.6.5

自己下载 `VMware Workstation Pro`

名称	下载地址	提取密码
CentOs7.ios	https://pan.baidu.com/s/1O_0ZU8gNd54MMWM7b6Bd8A	99f2
hadoop2.6.5	https://pan.baidu.com/s/1h2kM1sl08wwkqYDcI0h-NA	enim
jdk-8u201	https://pan.baidu.com/s/1EGRj1xqHKdvfNCGfgsQesg	cdon

1.下载VMware虚拟机安装CentOs7.ios虚拟机

虚拟机联网执行 vi /etc/sysconfig/network-scripts/ifcfg-ens33 修改ONBOOT=yes
虚拟机拿到hadoop-2.6.5.tar.gz和jdk-8u201-linux-x64.tar.gz文件后，假设在/opt目录下

2.解压java jdk，配置java环境变量

执行解压 tar -xzvf /opt/jdk-8u201-linux-x64.tar.gz 得到 /opt/jdk1.8.0_201
执行 vi /etc/profile 打开设置环境变量文件新增

export JAVA_HOME=/opt/jdk1.8.0_201
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH

3。解压hadoop，并配置

执行解压 tar -xzvf /opt/hadoop-2.6.5.tar.gz 得到 /opt/hadoop-2.6.5
执行 vi /etc/profile 打开设置环境变量文件新增

export HADOOP_HOME=/opt/hadoop-2.6.5
export PATH=$PATH:$HADOOP_HOME/bin

修改hadoop的java环境变量 vi /opt/hadoop-2.6.5/etc/hadoop/hadoop-env.sh 新增 export JAVA_HOME=/opt/jdk1.8.0_201
修改hadoop配置 vi /opt/hadoop-2.6.5/etc/hadoop/core-site.xml新增

    <configuration>
        <property>
            <name>fs.defaultFS</name>
            <value>hdfs://localhost:9000</value>
            <!--9000是随便写的 随便写都行-->
        </property>
    </configuration>

修改hadoop配置 vi /opt/hadoop-2.6.5/etc/hadoop/hdfs-site.xml新增

    <configuration>
        <property>
            <name>dfs.replication</name>
            <value>1</value>
        </property>
    </configuration>

cd /opt/hadoop-2.6.5 执行 ./bin/hadoop namenode -format 格式化hdfs
cd /opt/hadoop-2.6.5 执行 ./sbin/start-dfs.sh 启动hadoop; ./sbin/stop-dfs.sh是暂停命令
执行jps检查是否执行成功,下面则证明执行成功

    34208 SecondaryNameNode
    34002 NameNode
    38020 Jps
    33848 DataNode

4.编写`MapReduce`

"任何可以使用JavaScript来编写的应用，最终会由JavaScript编写。"

1. centOs 安装node环境

1. 在`/opt`下执行 `wget http://nodejs.org/dist/v8.12.0/node-v8.12.0.tar.gz`获取node包

2. 执行`tar zxvf node-v8.12.0.tar.gz`解压

3. 执行`vi /etc/profile`添加`node`环境变量

export NODE_HOME=/opt/node-v8.12.0
export PATH=$NODE_HOME/bin:$PATH

2. 目录结构

 ./map.js
 ./reduce.js
 ./wordcount.txt

3. `wordcount.txt` 内容

    js java python js java js go react vue vue

4. `map.js` 内容

const readline = require('readline')
const rl = readline.createInterface({
    input: process.stdin,
    output: process.stdout
})
rl.on('line', line => {
    line.aplit(' ').map(word => {
        console.log(`${word}\tl`)
    })
})
rl.on('close', () => {
    process.exit(0)
})

5. `reduce.js` 内容

const reduline = require('readline')
const rl = readline.createInterface({
    input: process.stdin,
    output: process.stdout,
    terminal: false
})

let words = new Map()

rl.on('line', line => {
    const [word, count] = line.split('\t')
    if (!words.has(word)) {
        words.set(word, parseInt(count))
    } else {
        words.set(word, words.get(word) + 1)
    }
})

rl.on('clise', () => {
    words.forEach((v, k) => {
        console.log(`${k}\t${v}`)
    })
    process.exit(0)
})

5. 执行`MapReduce`

假设文件路径为

 /opt/test/map.js
 /opt/test/reduce.js
 /opt/test/wordcount.txt

执行chmod +x /opt/test/map.js /opt/test/reduce.js将map.js和reduce.js变成可执行文件
执行 hadoop fs -mkdir /input给hadoop文件系统根目录创建input文件夹
执行 hadoop fs -put /opt/test/wordcount.txt /input 将wordcount.txt放在input文件夹内
进入test文件夹cd /opt/test 执行

hadoop jar $HADOOP_HOME/share/hadoop/tools/lib/hadoop-streaming-2.6.5.jar -input /input/wordcount.txt -output /output -mapper "node ./map.js" -reducer "node ./reduce.js"

截至目前任务已经提交运行完
执行hadoop fs -ls /output 查看hadoop文件系统/output目录

    -rw-r--r--   1 root supergroup          0 2019-04-11 14:33 /output/_SUCCESS
    -rw-r--r--   1 root supergroup         40 2019-04-11 14:33 /output/part-00000

执行hadoop df -cat /output/part-00000查看输出文件

go	1
java	2
js	3
python	1
react	1
vue	2

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

centOS7 搭建单机版hadoop2.6.5

自己下载 `VMware Workstation Pro`

1.下载VMware虚拟机安装CentOs7.ios虚拟机

2.解压java jdk，配置java环境变量

3。解压hadoop，并配置

4.编写`MapReduce`

"任何可以使用JavaScript来编写的应用，最终会由JavaScript编写。"

1. centOs 安装node环境

1. 在`/opt`下执行 `wget http://nodejs.org/dist/v8.12.0/node-v8.12.0.tar.gz`获取node包

2. 执行`tar zxvf node-v8.12.0.tar.gz`解压

3. 执行`vi /etc/profile`添加`node`环境变量

2. 目录结构

3. `wordcount.txt` 内容

4. `map.js` 内容

5. `reduce.js` 内容

5. 执行`MapReduce`

About

Uh oh!

Releases

Packages

webkonglong/centos7-hadoop-javascript

Folders and files

Latest commit

History

Repository files navigation

centOS7 搭建 单机版hadoop2.6.5

自己下载 VMware Workstation Pro

1.下载VMware虚拟机安装CentOs7.ios虚拟机

2.解压java jdk，配置java环境变量

3。解压hadoop，并配置

4.编写MapReduce

"任何可以使用JavaScript来编写的应用，最终会由JavaScript编写。"

1. centOs 安装node环境

1. 在/opt下执行 wget http://nodejs.org/dist/v8.12.0/node-v8.12.0.tar.gz获取node包

2. 执行tar zxvf node-v8.12.0.tar.gz解压

3. 执行vi /etc/profile添加node环境变量

2. 目录结构

3. wordcount.txt 内容

4. map.js 内容

5. reduce.js 内容

5. 执行MapReduce

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

centOS7 搭建单机版hadoop2.6.5

自己下载 `VMware Workstation Pro`

4.编写`MapReduce`

1. 在`/opt`下执行 `wget http://nodejs.org/dist/v8.12.0/node-v8.12.0.tar.gz`获取node包

2. 执行`tar zxvf node-v8.12.0.tar.gz`解压

3. 执行`vi /etc/profile`添加`node`环境变量

3. `wordcount.txt` 内容

4. `map.js` 内容

5. `reduce.js` 内容

5. 执行`MapReduce`

Packages