网站用户行为分析

时间:2021-01-02 11:41:47   收藏:0   阅读:0

网站用户行为分析

  1. 步骤

1.1 本地数据集上传到数据仓库Hive

  1. 数据集下载与查看
  2. 数据集预处理
  3. 把数据集导入HDFS中
  4. 在Hive上创建数据库

1.2 Hive数据分析

  1. 给出数据分析需求
  2. 用select语句实现数据分析
  3. 数据分析结果查看与保存 

1.3 Hive、MySQL、HBase数据互导

 

  1. 操作过程

2.1 数据准备

第一步,通过samba服务共享文件

技术图片

 

 

技术图片

第二步,数据下载预处理

技术图片

第三步,将数据上传至hdfs

技术图片

第四步,在hive上创建数据库和表

技术图片

第五步,查看创建表的数据类型与信息

技术图片

2.2 Hive数据分析

(1)用户行为分析需求:2014-12-11~12号有多少条购买商品的记录

    分析步骤

(2)用户行为分析需求:分析每月1-31号购买情况

(3)自定义需求:

12月10号买了超过四种商品的用户id

语句:select uid from bigdata_user where behavior_type=‘4‘ and visit_date=‘2014-12-10‘ group by uid having count(behavior_type=‘4‘)>5;

技术图片

 

10号,购买,3项以上

 

 语句:select uid,count(*) from bigdata_user where behavior_type=‘4‘and visit_date=‘2014-12-10‘ group by uid having count(*)>3 limit 10;

技术图片

 

 

通国际当天购买商品钟类为3的天数,并保存到表中

语句:create table day_count_3 as select count(*),day(visit_date) from bigdata_user where behavior_type=‘3‘ group by day(visit_date);

技术图片

 

评论(0
© 2014 mamicode.com 版权所有 京ICP备13008772号-2  联系我们:gaon5@hotmail.com
迷上了代码!