前置


知识概括

大数据就是:使用分布式技术完成海量数据的处理,得到数据背后蕴含的价值

2008年Apache Hadoop开源了

在VMware的虚拟网络编辑器中,将VMnet8虚拟网卡的:

  • 网段设置为:192.168.88.0
  • 网关设置为:192.168.88.2

前置环境配置准备:

  1. 设置三台Linux虚拟机的主机名和固定IP
  2. 在Linux系统以及本机系统中配置了主机名映射
  3. 配置了三台服务器之间root用户的SSH免密互通
  4. 安装配置了JDK环境
  5. 关闭了防火墙和SELinux
  6. 更新了时区和同步了时间
  7. 拍摄快照保存状态

Hadoop可以提供:

  • 分布式数据存储(HDFS)
  • 分布式数据计算(MapReduce)
  • 分布式资源调度(Yarn)