返回
Featured image of post Tenrec 数据集上 CTR 预测模型大乱斗

Tenrec 数据集上 CTR 预测模型大乱斗

在 Tenrec 数据集上,CTR 预测模型大乱斗

Tenrec 数据集

Tenrec 是腾讯在2022年发布的一个大规模推荐系统基准数据集,包含了来自两个信息流推荐平台(文章和视频)的用户行为数据。数据集包括:

  1. QK-video.csv:QK平台的用户视频行为数据
  2. QB-video.csv:QB平台的用户视频行为数据
  3. QK-article.csv:QK平台的用户文章行为数据
  4. QB-article.csv:QB平台的用户文章行为数据

数据集是我从官方网站下载的,使用前需要接受许可协议。

Tenrec支持10个推荐任务,包括CTR预测、Top-N推荐等,这里我先尝试CTR预测任务。

在这个实验中,我们对比了多个经典的CTR预测模型在Tenrec数据集上的表现。这些模型包括:

  • AFM:注意力因子分解机,通过注意力机制对特征交互进行加权
  • DCN/DCN-v2:深度交叉网络,通过特殊的交叉层实现特征的高阶组合
  • NFM:神经因子分解机,将FM的二阶交互通过神经网络进行非线性变换
  • Wide&Deep:结合记忆能力和泛化能力的经典双塔模型
  • DIN:深度兴趣网络,通过注意力机制建模用户的动态兴趣
  • DeepFM:将FM和深度学习模型进行端到端的联合训练
  • xDeepFM:通过显式和隐式的特征交叉提升模型表达能力

我们使用AUC和Logloss作为评估指标,同时也关注模型的训练效率。下面是详细的实验结果

最后一轮的训练集数据

模型 AUC Logloss 训练时长(s) 验证集AUC
AFM 0.8174 0.4865 4497 0.7863
DCN 0.9363 0.3014 1407 0.7155
DCN-v2 0.9427 0.2860 1601 0.7125
NFM 0.8752 0.4129 1745 0.7595
Wide&Deep 0.9029 0.3675 1546 0.7377
DIN 0.9197 0.3345 1569 0.7192
DeepFM 0.9404 0.2919 2290 0.7131
xDeepFM 0.9731 0.1979 2832 0.7038

测试集实验结果

模型 AUC Logloss
AFM 0.7859 0.5178
DCN 0.7156 0.8212
DCN-v2 0.7123 0.8732
NFM 0.7593 0.5782
Wide&Deep 0.7378 0.6679
DIN 0.7189 0.8333
DeepFM 0.7134 0.8293
xDeepFM 0.7037 1.0298
© 2023 - 2025 壹壹贰捌· 0Days
共书写了258.6k字·共 93篇文章 京ICP备2023035941号-1