随着电商平台、 门户网站的访问量越来越大, 产生的日志信息也越来越多, 传统的日志文件处理方法无法满足需求。通过分析Hadoop分布式文件系统 (HDFS)、 并行计算框架MapReduce和数据仓库Hive技术特点, 研究日志仓库的体系结构及关键技术并建立日志数据仓库。与数据库相比, 数据处理效率显著提升。