一、原始RFM模型涉及的数据字段:
Recency: 客户最近一次购买的时间(距离当前日期的天数)
last_purchase_date 需计算与当前日期的差值
recent_purchase_days 直接可用
Frequency: 客户在统计周期内的购买次数
purchase_count :次数(int型数值)
Monetary:客户在统计周期内的总消费金额
total_spent:总金额(int型数值)
二、客户标识字段
1. 客户ID:customer_id
2. 客户基本信息:gender, age,location
三、订单相关字段
1. 订单ID:order_id
2. 订单日期:order_date
3. 订单金额:order_amount
4. 商品信息:product_id, product_category
四、统计周期字段
1. 统计周期开始日期:start_date
2. 统计周期结束日期:end_date
五、优化模型或丰富客户画像的相关字段(非必须)
1. 客户活跃度:active_days(登录天数)
2. 客户生命周期:customer_lifetime(首次购买到最后一次购买到时间跨度)
3. 营销活动参与度:campaign_participation(参与活动次数)
六、数据收集注意事项
- 数据完整性:确保核心字段(如
customer_id,order_date,order_amount)无缺失。 - 数据准确性:检查数据是否存在异常值(如负的订单金额、未来的订单日期)。
- 数据一致性:确保时间格式、货币单位等字段统一。
- 数据规模:尽量覆盖足够的时间范围(如1年)和客户数量(如1000+客户)。
- 隐私保护:确保客户数据经过脱敏处理,符合隐私保护法规。

3805

被折叠的 条评论
为什么被折叠?



