NewMer-新建流程任务

流程：产品销售数据分析[userPurchase2]

查看示例帮助文档

时间 2025-03-04 查看流程图

分析用户购买行为的特征，找出高价值用户群体。识别影响用户购买决策的关键因素（如价格、产品类别等）。预测用户的复购概率

运行环境

在线本地：无查看/配置环境

参数设置

任务名称

基本参数

数据表

选择文件文件预览上传临时文件粘贴内容

用户列名

价格列名

年龄列名

是否购买列的列名

商品编号列名

删除缺失行（指定列）

在指定的变量中，删除缺失值比例大于阈值的行

缺失比例阈值

缺失值统计和填充

填充方法有去除行、均值、中位数、众数填充，前向填充、后向填充

填充方法

频数统计（按区间）

统计某一列值的区间分布。包括KDE计算

区间数量

聚类-kmean聚类

kmeans聚类大致过程 1.假定对N个样本观测做聚类，要求聚为K类，首先选择K个点作为初始中心点； 2.按照距离初始中心点最小的原则，把所有观测分到各中心点所在的类中； 3.每类中有若干个观测，计算K个类中所有样本点的均值，作为第二次迭代的K个中心点； 4.然后根据这个中心重复第2、3步，直到收敛（中心点不再改变或达到指定的迭代次数），聚类过程结束采用的程序是python的sklearn.cluster.KMeans 详见： http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html

聚类数

Apriori算法关联分析

经典的关联规则学习算法，主要用于从大量事务型数据中发现频繁项集和关联规则。该算法广泛应用于市场篮子分析、推荐系统等场景

频繁项集的最小支持度

关联规则的最小置信度

Logistic回归

因变量为类别型。兼容二分类和多分类

自变量列名(英文逗号连接)

登录运行

环境

软件:

数据库:

其他:

木牛零码