推广 热搜: 行业  机械  设备    经纪  教师  系统  参数    蒸汽 

数据分析案例--淘宝用户行为分析

   日期:2024-11-10     移动:http://zleialh.xhstdz.com/mobile/quote/73718.html

一、项目背景 对淘宝用户行为进行分析,从而探索淘宝用户的行为模式,具体指标包括:日PV和日UV分析,付费率分析,复购行为分析,漏斗流失分析和用户价值RFM分布 二、数据来源 https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1 三、提出问题 1.日PV有多少 2.日UV有多少 3.付费率情况如何 4.复购率是多少 5.漏斗流失情况如何 6.用户价值情况 四、理解数据 本数据集共有104万条左右数据,数据为淘宝APP2014年11月18日到2014年12月18日的用户行为数据,共计6列字段,列字段分别是: user_id:用户身份,脱敏 item_id:商品ID,脱敏 behavior_type:用户行为类型(包含点击,收藏,加购物车,支付四种行为,分别用数字1、2、3、4表示) user_geohash:地理位置 item_category:品类ID(商品所属的品类) time:用户行为发生的时间 五、数据清洗 5.1导入python中的包

数据分析案例--淘宝用户行为分析

 

读取前5行 在这里插入图片描述 看看一共有多少行的数据

 

在这里插入图片描述 查看数据类型

 

在这里插入图片描述 5.2缺失值处理

 

在这里插入图片描述 可以看到user_geohash缺失值为8334824,而其他列不缺

这个缺失值,不能删除,因为有其他的关联信息,所以我们这里暂不处理 5.3数据处理。拆数据集 在这里插入图片描述 我们把日期和小时拆开,分成两列 拆分日期

 

拆分小时

 

在这里插入图片描述 可以看到已经拆分成两列了


下面讲解一下,这个re.compile()函数 在这里插入图片描述


5.4查看data_user数据集数据类型

 

在这里插入图片描述 发现time列和date列应该转化为日期类数据类型,hour列应该是字符串数据类型

 

在这里插入图片描述 5.5异常值处理

 

在这里插入图片描述

 

在这里插入图片描述

本文地址:http://zleialh.xhstdz.com/quote/73718.html    物流园资讯网 http://zleialh.xhstdz.com/ , 查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


0相关评论
相关最新动态
推荐最新动态
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号