大数据技术(入门篇) --- centos7安装CDH6.2集群

news2025/6/18 9:32:52

随着信息化时代的进步,业务系统的数据量出现了爆发式的增长,带来的不良结果就是数据库的数据量剧增,而部分业务系统需要实时数据,有些业务系统需要离线计算后的数据,所以就产生了大数据技术,因此最近在学习大数据相关的知识点,先从最简单的,搭建开始

下载相关资源文件

CDH-6.2.0-1.cdh6.2.0.p0.967373-el7 压缩包,内含JDK
链接: https://pan.baidu.com/s/13yexjyrqJtwDmRZq7fXo9g 密码: wfwa

CentOS 7.6 IOS 镜像
链接: https://pan.baidu.com/s/1Sl3xWtNK0dFiKp9s9Yt3DQ 密码: umpl

准备虚拟机环境

  • cdh-master 192.168.1.56
  • cdh-slave-1 192.168.1.57
  • cdh-slave-2 192.168.1.58

分别设置主机名称

hostnamectl set-hostname cdh-master

在这里插入图片描述

分别修改hosts,设置ip映射关系

echo \
"192.168.1.56 cdh-master
192.168.1.57  cdh-slave-1
192.168.1.58  cdh-slave-2" >> /etc/hosts

在这里插入图片描述

所有节点关闭selinux

# 永久关闭
# 修改/etc/selinux/config 文件
# 将SELINUX=enforcing改为SELINUX=disabled
sed -i '/SELINUX=/c SELINUX=disabled' /etc/selinux/config

在这里插入图片描述

关闭所有节点防火墙

CENTOS7的防火墙是firewalld

# 禁用 firewalld
systemctl stop firewalld

# 禁用 firewalld
systemctl disable firewalld

在这里插入图片描述

设置免密登录

因为CDH内有Hadoop,所以建议所有节点都做免密登录,无需包含本身节点,比如master只需要添加slave即可

#生产密钥
ssh-keygen -t rsa

cd ~/.ssh/
cp id_rsa.pub authorized_keys
# 下面的命令是把其他主机的公钥复制到本机
ssh-copy-id -i root@cdh-master
ssh-copy-id -i root@cdh-slave-1
ssh-copy-id -i root@cdh-slave-2

在这里插入图片描述

配置时间同步服务

我这里使用的是 ntp

 yum -y install ntp

修改配置文件

修改 /etc/ntp.conf 设置同步服务器为 server ntp.aliyun.com
在这里插入图片描述

设置定时任务

echo "*/10 * * * * /usr/sbin/ntpdate ntp.aliyun.com >> /var/log/ntpdate.log" >> /etc/crontab

开启时间同步服务

 systemctl start ntpd
 systemctl enable ntpd

微调系统参数

sysctl vm.swappiness=10

echo 'vm.swappiness=10' >> /etc/sysctl.conf

echo never > /sys/kernel/mm/transparent_hugepage/defrag

echo never > /sys/kernel/mm/transparent_hugepage/enabled

echo 'echo never > /sys/kernel/mm/transparent_hugepage/defrag'  >> /etc/rc.local

echo 'echo never > /sys/kernel/mm/transparent_hugepage/enabled'  >> /etc/rc.local

配置CDH环境

master节点安装MySQL

我这里的MySQL只是一个演示作用,实际生产环境请使用可靠性好的MySQL服务

# 下载 MYSQL 5.7
wget http://dev.mysql.com/get/mysql57-community-release-el7-11.noarch.rpm

yum -y install mysql57-community-release-el7-11.noarch.rpm

yum -y install mysql-server  --nogpgcheck   # 不校验数字签名

# 启动 MySQL 5.7
systemctl start mysqld.service
systemctl status mysql.service

在这里插入图片描述

登录MySQL 并创建相关用户和数据库

#进入mysql
mysql -uroot -proot

#修改root的远程访问权限,提供给客户端访问能力
mysql> GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY 'root' WITH GRANT OPTION;


create database cmserver default charset utf8 collate utf8_general_ci;
grant all on cmserver.* to 'cmserveruser'@'%' identified by 'cmserveruser';

create database metastore default charset utf8 collate utf8_general_ci;
grant all on metastore.* to 'hive'@'%' identified by 'hive';

create database amon default charset utf8 collate utf8_general_ci;
grant all on amon.* to 'amonuser'@'%' identified by 'amonuser';

create database rman default charset utf8 collate utf8_general_ci;
grant all on rman.* to 'rmanuser'@'%' identified by 'rmanuser';

CREATE DATABASE hue DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
GRANT ALL ON hue.* TO 'hue'@'%' IDENTIFIED BY 'hue';

CREATE DATABASE oozie DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
GRANT ALL ON oozie.* TO 'oozie'@'%' IDENTIFIED BY 'oozie';

# flush
FLUSH PRIVILEGES;

各节点下载并安装Oracle JDK

最好使用Oracle JDK,使用者请仔细斟酌
JDK 文件位于 压缩包中

rpm -ihv oracle-j2sdk1.8-1.8.0+update181-1.x86_64.rpm

# 配置环境变量
export JAVA_HOME=/usr/java/jdk1.8.0_181-cloudera
export PATH=$PATH:$JAVA_HOME/bin
# 刷新环境变量
source /etc/profile

主节点执行安装


######################## MySQL 驱动处理开始 ########################
yum install unzip -y
# 下载驱动程序
wget https://dev.mysql.com/get/Downloads/Connector-J/mysql-connector-java-5.1.47.zip

# 解压 mysql-jdbc 驱动包
unzip mysql-connector-java-5.1.47.zip

# 创建mysql 驱动目录,cdh 默认在这个目录中寻找mysql 链接驱动程序
mkdir -p /usr/share/java

# 拷贝驱动程序到指定目录
mv mysql-connector-java-5.1.47/mysql-connector-java-5.1.47.jar  /usr/share/java/mysql-connector-java.jar

######################## MySQL 驱动处理结束 ########################


########################## 安装 CM 开始 ###########################
# 安装httpd
yum --disableexcludes=all install -y httpd

# 创建 cloudera 目录
mkdir -p /opt/cloudera/parcel-repo/

# 
mv CDH-6.2.0-1.cdh6.2.0.p0.967373-el7.parcel* /opt/cloudera/parcel-repo/
mv manifest.json /opt/cloudera/parcel-repo/

# 安装CM相关资源文件
yum localinstall -y cloudera-manager-daemons-6.2.0-968826.el7.x86_64.rpm 
yum localinstall -y cloudera-manager-agent-6.2.0-968826.el7.x86_64.rpm
yum localinstall -y cloudera-manager-server-6.2.0-968826.el7.x86_64.rpm

# 修改cm相关数据库配置
vim /etc/cloudera-scm-server/db.properties
# The database type
# Currently 'mysql', 'postgresql' and 'oracle' are valid databases.
com.cloudera.cmf.db.type=mysql
# The database host
# If a non standard port is needed, use 'hostname:port'
com.cloudera.cmf.db.host=cdh-master
# The database name 数据库和上方的 SQL语句要对应上
com.cloudera.cmf.db.name=cmserver
# The database user 数据库用户名称和上方的 SQL语句要对应上
com.cloudera.cmf.db.user=cmserveruser
# The database user's password 数据库用户密码和上方的 SQL语句要对应上
com.cloudera.cmf.db.password=cmserveruser
com.cloudera.cmf.db.setupType=EXTERNAL

########################## 安装 CM 结束 ###########################



########################## 配置 探针 开始 ###########################
# 设置探针
vim /etc/cloudera-scm-agent/config.ini
# Hostname of the CM server.
server_host=cdh-master
# Port that the CM server is listening on.
server_port=7182
########################## 配置 探针 结束 ###########################


# 启动主节点
systemctl start cloudera-scm-server
systemctl status cloudera-scm-server

slave 节点

执行安装

# 安装守护程序
yum localinstall -y cloudera-manager-daemons-6.2.0-968826.el7.x86_64.rpm 
# 安装探针程序
yum localinstall -y cloudera-manager-agent-6.2.0-968826.el7.x86_64.rpm


# 配置探针
vim /etc/cloudera-scm-agent/config.ini
# Hostname of the CM server.
server_host=cdh-master
# Port that the CM server is listening on.
server_port=7182


# 启动slave节点
systemctl start cloudera-scm-agent
systemctl status cloudera-scm-agent

查看效果

控制台地址:cdh-master:7180
账号密码 admin/admin
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/411811.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

面试官:说一说mysql的varchar字段最大长度?

在mysql建表sql里,我们经常会有定义字符串类型的需求。 CREATE TABLE user (name varchar(100) NOT NULL DEFAULT COMMENT 名字 ) ENGINEInnoDB DEFAULT CHARSETutf8mb4 ;比方说user表里的名字,就是个字符串。mysql里有两个类型比较适合这个场景。 ch…

剧本拆分如何用ai人工智能辅助完成

随着现代技术的发展,人工智能在电影制作领域中的应用已经越来越普遍。其中,辅助剧本拆分是人工智能技术的一种重要应用。人工智能可以帮助电影制作人员更快速、更准确地进行剧本拆分,提高制作效率和创作质量。 剧本拆分是电影制作中非常重要的…

二叉树的链式结构

思维导图 二叉树的创建 先定义一个二叉树链式结构的结构体 typedef int BTDatatype; typedef struct BinaryTreeNode {struct BinaryTreeNode* left;struct BinaryTreeNode* right;BTDatatype data; }BTNode; 手搓一个二叉树(前序遍历的方式创建二叉树放到OJ题…

nm命令 以及 C++11 编译出现找不到stringstream 以及 undefined reference to `std::runtime_error

最近在学习ZLMediaKit 源码 里面用到了很多C11 的知识 本地有一个 ubuntu18.04 的服务器 源码下下来发现 直接编译报很多错误 比如 找不到 std::runtime_error 找不到 stringstream 等等等 后来偶然的机会发现 是libstdc.so.6 太老了 找一个新的 替换掉这个就可以 …

新 Nano(五)自己写个库,读 DHT11 / DHT22

DHT11 这款温湿度传感器 几乎是所有 MCU 入门第一个传感器, 现在看来有些不合时宜, 毕竟过于廉价,数据不太靠谱,远不如 AHT10 好用。早年买了两个,按例程读出数据后就吃灰了。某日看到有人说自己按datasheet去读&#…

c#快速入门~在java基础上,知道C#和JAVA 的不同即可

☺ 观看下文前提:如果你的主语言是java,现在想再学一门新语言C#,下文是在java基础上,对比和java的不同,快速上手C#,当然不是说学C#的前提是需要java,而是下文是从主语言是java的情况下&#xff…

CloudIDE 如何提升研发效能

原文作者:行云创新技术总监 邓冰寒 引言 CloudIDE ,一种基于云计算技术开发的云原生集成开发环境,可以帮助企业提高研发效能,实现数字化转型的目标。本文将探讨 CloudIDE 如何在数字化时代体现业务价值、提升研发效能。 CloudID…

【一起撸个DL框架】1 绪论

文章目录第一章 绪论 🍉1.1 在人工智能的大潮里1.2 为什么重复造轮子1.3 深度学习框架简介第一章 绪论 🍉 1.1 在人工智能的大潮里 人工智能——一个如今十分火热的话题,人们在生活中越来越多地使用它、谈论它。在2022年之前,人…

ChatGPT会取代律师这份职业吗?

如今,一种新型的人工智能威胁再次来袭,律师们可能会感到似曾相识的感觉。有人警告称,类似于ChatGPT的软件,因为具有类似于人类的语言流畅性,可能会取代大部分法律工作。 人工智能​的进步曾让人们预测,法律…

Linux 网络扫描工具:nmap,涨知识的时间到了!

在Linux系统中,nmap是一个非常流行的网络扫描工具。它可以用于探测主机和网络上的开放端口、操作系统类型、服务和应用程序等信息。nmap还可以与Ping命令结合使用,以便快速识别网络上的活动主机。本文将介绍如何在Linux上使用nmap和Ping命令进行扫描。 …

服务器部署需要注意的事项

前言:相信看到这篇文章的小伙伴都或多或少有一些编程基础,懂得一些linux的基本命令了吧,本篇文章将带领大家服务器如何部署一个使用django框架开发的一个网站进行云服务器端的部署。 文章使用到的的工具 Python:一种编程语言&…

在win10系统中使用EasyUEFI修复​Win10+Ubuntu双系统​引导启动项

我安装了Win10Ubuntu双系统,有一天电脑突然坏了开不了机,把硬盘拆下放到别的机器上,发现是直接进入Win10系统,而不是grub选择界面。进F12也找不到ubuntu的启动项。 之前网上的修复方法是: 1. 首先你需要一张ubuntu的…

多智能体强化学习论文导读

Adaptive Value Decomposition with Greedy Marginal Contribution Computation for Cooperative Multi-Agent Reinforcement Learning Dec-POMDP 本文的研究对象是 decentralized partially observable Markov decision process (Dec-POMDP), 我们首先来看一下它和经典的MDP…

用HTTP proxy module配置一个而反向代理服务器

反向代理与正向代理 摘抄:https://cloud.tencent.com/developer/article/1418457 正向代理 正向代理(forward proxy):是一个位于客户端和目标服务器之间的服务器(代理服务器),为了从目标服务器取得内容,…

2023-04-11 无向图的匹配问题

无向图的匹配问题 之所以把无向图的这个匹配问题放到最后讲是因为匹配问题借鉴了有向图中一些算法的思想 1 最大匹配和完美匹配 二分图回顾 二分图:把一个图中的所有顶点分成两部分,如果每条边的两端分别属于不同部分,则这个图是二分图。更多…

银行数字化转型导师坚鹏:金融科技与数字化转型成功案例

金融科技与数字化转型成功案例课程背景: 数字化转型背景下,很多银行存在以下问题: 不清楚金融科技如何赋能数字化转型? 不清楚银行金融科技体系的建设情况? 不了解银行数字化转型标杆成功案例? 课程特色…

AD六层板布线经验累积

目录 1、布局: 2、创建电源类PWR 3、高速部分可以加屏蔽罩, 4、EMMC和NANDFLASH采取兼容放置(创建联合) 5、HDMI设计 6、就近原则摆放 7、AV端口 8、模拟信号(1字型或L型走线) 9、WIFI模块 10、局…

Python+ChatGPT实战之进行游戏运营数据分析

文章目录一、数据二、目标三、解决方案1. DAU2. 用户等级分布3. 付费率4. 收入情况5. 付费用户的ARPU最近ChatGPT蛮火的,今天试着让ta写了一篇数据分析实战案例,大家来评价一下!一、数据 您的团队已经为您提供了一些游戏数据,包括…

考研数二第十七讲 反常积分与反常积分之欧拉-泊松(Euler-Poisson)积分

反常积分 反常积分又叫广义积分,是对普通定积分的推广,指含有无穷上限/下限,或者被积函数含有瑕点的积分,前者称为无穷限广义积分,后者称为瑕积分(又称无界函数的反常积分)。 含有无穷上限/下…

基于粒子群优化算法的分布式电源选址与定容【多目标优化】【IEEE33节点】(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…