反馈咨询
欢迎添加微信!
微信号:z_gqing
微信二维码:

流程:产品销售数据分析[userPurchase2]

查看流程图
分析用户购买行为的特征,找出高价值用户群体。 识别影响用户购买决策的关键因素(如价格、产品类别等)。 预测用户的复购概率

运行环境

参数设置

基本参数

删除缺失行(指定列)

在指定的变量中,删除缺失值比例大于阈值的行

缺失值统计和填充

填充方法有去除行、均值、中位数、众数填充,前向填充、后向填充

频数统计(按区间)

统计某一列值的区间分布。包括KDE计算

聚类-kmean聚类

kmeans聚类大致过程 1.假定对N个样本观测做聚类,要求聚为K类,首先选择K个点作为初始中心点; 2.按照距离初始中心点最小的原则,把所有观测分到各中心点所在的类中; 3.每类中有若干个观测,计算K个类中所有样本点的均值,作为第二次迭代的K个中心点; 4.然后根据这个中心重复第2、3步,直到收敛(中心点不再改变或达到指定的迭代次数),聚类过程结束 采用的程序是python的sklearn.cluster.KMeans 详见: http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html

Apriori算法关联分析

经典的关联规则学习算法,主要用于从大量事务型数据中发现频繁项集和关联规则。该算法广泛应用于市场篮子分析、推荐系统等场景

Logistic回归

因变量为类别型。兼容二分类和多分类

登录运行

环境

通明学练 数据挖掘 NGplot绘图 NewMer生信首页

关注我们获取最新动态和更多干货内容

微信公众号:NewMer生信 小红书号:NewMer B站:Newmer生信 抖音:NewMer生信 知乎:NewMer生信 客服微信号:z_gqing
Copyright © 2021-2025 上海牛马人生物科技有限公司 沪ICP备 2022007390号-2