目录 第1章项目概述1 1.1项目需求和目标1 1.2预备知识2 1.3项目架构3 1.4开发环境和工具3 1.5项目开发流程5 1.6本章小结6 第2章搭建集群环境7 2.1基础环境搭建7 2.1.1创建虚拟机7 2.1.2安装Linux操作系统15 2.1.3克隆虚拟机23 2.1.4配置虚拟机26 2.2安装JDK38 2.3部署Hadoop集群42 2.4部署Hive50 2.5部署Flume56 2.6部署ZooKeeper集群57 2.7部署Kafka集群61 2.8部署Spark64 2.9部署Doris集群67 2.10本章小结74 第3章数据采集75 3.1用户行为数据概述75 3.2模拟生成用户行为数据76 3.2.1生成历史用户行为数据77 3.2.2生成实时用户行为数据82 3.3配置采集方案83 3.4采集用户行为数据87 3.5本章小结91 第4章数据仓库92 4.1 数据仓库设计92 4.2构建数据仓库96 4.3向数据仓库加载数据100 4.3.1向ODS层的表加载数据101 4.3.2向DWD层的表加载数据103 4.4本章小结112 第5章数据分析113 5.1流量分析113 5.2商品分析119 5.3设备分析123 5.4推荐系统127 5.5地域分析133 5.6本章小结138 第6章数据可视化139 6.1Doris集成Hive139 6.2FineBI的安装与配置143 6.3实现数据可视化152 6.3.1新建数据集152 6.3.2实现流量分析的可视化158 6.3.3实现商品分析的可视化169 6.3.4实现设备分析的可视化175 6.3.5实现地域分析的可视化178 6.4本章小结184