CDH部署HDFS详细指南
CDH部署HDFS详细指南
Cloudera Distribution of Hadoop (CDH) 是一个完整的Hadoop生态系统发行版。本文将详细介绍如何使用CDH部署HDFS集群。
1. 环境准备
1.1 系统要求
1.1.1 硬件要求
-
服务器配置
- CPU:建议8核以上
- 内存:建议32GB以上
- 磁盘:建议使用企业级SAS或SSD
- 网络:建议万兆网络
-
集群规模
- 小型集群:3-5节点
- 中型集群:6-20节点
- 大型集群:20节点以上
1.1.2 软件要求
-
操作系统
- CentOS 7.x
- RHEL 7.x
- Ubuntu 16.04/18.04
- 建议使用64位系统
-
依赖软件
- JDK 8
- Python 2.7
- NTP服务
- SSH服务
1.2 网络配置
1.2.1 网络规划
-
主机名配置
- 统一命名规范
- 配置hosts文件
- 确保主机名解析
-
网络设置
- 静态IP配置
- 防火墙配置
- 端口开放
- 网络连通性测试
1.2.2 安全配置
-
SSH配置
- 密钥认证
- 无密码登录
- 权限设置
- 安全加固
-
防火墙配置
- 开放必要端口
- 限制访问范围
- 安全策略设置
- 日志记录
2. CDH安装
2.1 安装Cloudera Manager
2.1.1 准备工作
- 配置yum源
# 创建Cloudera Manager仓库文件
cat > /etc/yum.repos.d/cloudera-manager.repo << EOF
[cloudera-manager]
name=Cloudera Manager
baseurl=https://archive.cloudera.com/cm6/6.3.1/redhat7/yum/
gpgkey=https://archive.cloudera.com/cm6/6.3.1/redhat7/yum/RPM-GPG-KEY-cloudera
gpgcheck=1
enabled=1
EOF
- 安装依赖包
yum install -y oracle-j2sdk1.8
yum install -y cloudera-manager-daemons cloudera-manager-agent
2.1.2 初始化数据库
- 安装MySQL
yum install -y mysql-connector-java
yum install -y mysql-server
- 配置MySQL
CREATE DATABASE scm DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
CREATE DATABASE amon DEFAULT CHARACTER SET<