计算机工程与应用 ›› 2020, Vol. 56 ›› Issue (14): 118-122.DOI: 10.3778/j.issn.1002-8331.1904-0395
王丽苗,许青林,姜文超,符基高
WANG Limiao, XU Qinglin, JIANG Wenchao, FU Jigao
摘要:
短视频喜好率预测往往面临着用户及广告的数量巨大且训练数据集高维、稀疏等问题,从而导致预测准确度下降。针对这些问题提出了基于LDA-GBDT-FM的短视频喜好率预测模型,该模型利用隐狄利克雷分配模型(LDA)对原始数据集基于主题分割,利用梯度提升决策树(GBDT)对不同主题的子训练集提取连续型特征的高影响力特征,将其与离散特征合并来训练因子分解机(FM)模型,最后有效组合子模型,进而预测短视频的喜好率。实验基于Bytedance公司的数据集,实验结果表明,提出的LDA-GBDT-FM模型相较于LDA-FM、FM和LR在预测指标上分别提高了3.0%、5.7%和8.5%。