题名互联网服务排名优化关键技术研究
作者涂丹丹
答辩日期2011-05-31
文献子类博士
授予单位中国科学院研究生院
授予地点北京
导师徐志伟
关键词互联网服务排名 上下文广告推荐算法 付费搜索 在线学习算法 近似消息传递算法
学位专业其它专业
英文摘要互联网已成为人们获取信息的重要手段。日益扩张的互联网使用户获取有用的服务变得越来越艰难,如何快速且高质量地为用户提供符合其需求的互联网服务显得尤为重要。互联网服务排名为人们获取信息提供了便利。互联网服务排名问题的直观描述为:给定上下文,对排名对象集合排列,将目标函数最大化。互联网服务排名的准确率对服务盈利有重要影响。本文主要研究互联网服务排名准确率优化问题。 本文主要工作和贡献如下: (1)基于多个关键特征采用机器学习方法解决开放服务质量排名问题。开放服务质量排名可帮助服务组合的应用程序选择更好的服务。与其他排名问题不同的是,开放服务质量好坏取决于多个关键特征。不同类型的服务具有不同的关键特征,此外,关键服务的重要程度也不一样。本文将开放服务质量排名问题分为四个子问题,即根据服务功能对服务分类、识别决定服务质量的关键特征、主观特征去噪、基于多个关键特征计算服务综合评分值。四个子问题被转化为四个机器学习问题分别利用分类、特征选择、聚类,回归方法求解。特别地,我们提出一种有效的基于密度块的主观特征去噪方法DBL,并且利用支持向量回归方法计算服务综合评分。基于合成数据和实际数据实验结果表明,该方法能定量识别不同类别服务的关键特征,去噪方法DBL 比k-means 聚类算法计算速度提高10 倍,并且本文提出的基于多个关键特征计算综合评分的方法具有较高的准确率。 (2)针对传统的上下文推荐算法通常对长尾特性的数据预测准确度不高的问题,本文提出了基于UPMF 方法进行上下文广告推荐新算法AdRec。基于给用户推荐其感兴趣且与浏览网页内容相关的广告可提高广告点击率的假设,该方法结合用户浏览网页信息、用户点击广告信息和网页与广告关联度等信息。在观测数据可表示成隐含特征的线性组合假设下,AdRec 使用隐含特征向量的内积之和来结合多方面信息,并使用逻辑斯蒂函数来预测广告点击率。基于某在线广告系统从2010 年8 月到10 月之间的3 个月实际运行数据(包含:40 万用户的互联网访问日志、185 个广告点击数据和广告投放数据)进行实验,实验结果表明:在数据稀疏的情形下,AdRec 算法推荐效果提高显著,其F值比其它四种推荐算法提高3.8%-8.4%。 (3)随着广告不断增加、替换和编辑,广告库不断变化,许多新广告历史点击数据很少甚至没有,这些因素使得新广告点击率估计成为一个极具挑战性的问题。本文主要是利用在广告层次结构中可观测到的点击率特征值基于混合高斯模型估计缺失的点击率特征值。本文利用EM 算法学习混合高斯模型参数,进而根据学习得到的参数推导出缺失的点击率特征值的后验分布,从而利用后验分布均值估计点击率特征缺失值。基于某互联网服务公司付费搜索广告系统2010 年12 月实际运行数据(包含:800 万用户的查询及约1000 个广告的点击信息)进行实验,实验结果表明混合高斯模型点击率预测均方差为10.5%-13.1%。此外,我们利用混合高斯模型填补的点击率特征值作为互联网服务公司当前点击率估计模型(logistic 回归模型)的输入特征,点击率特征填补后比填补前logistic 回归模型均方差提高7.16%。 (4)随着广告的不断展现,广告的点击反馈越来越多,由于用户兴趣爱好或环境等因素的变化,广告的点击率也在不断变化。如何根据用户兴趣喜好或环境等因素的变化快速且准确地估计广告点击率成为一个亟待解决的问题。本文提出一种在线学习算法AdInfer,基于因子图模型利用近似消息传递算法EP 更新模型参数,进而根据贝叶斯定理推导出广告点击率。随着新的点击反馈数据的出现,模型不断被修正,模型参数不断被在线更新。基于某互联网服务公司付费搜索广告系统2011 年1 月到2011 年2 月间的Acookie 日志(包含约600 万用户在其网站内相关行为信息及1000 个广告相关信息)进行实验,实验表明AdInfer 模型的自适应性比logistic 回归模型好,AUC 比logistic 回归模型提高1.1%-8.2%。
语种中文
公开日期2011-06-21
分类号TP3
内容类型学位论文
源URL[http://ictir.ict.ac.cn/handle/311040/1072]  
专题中国科学院计算技术研究所学位论文_2011博士
推荐引用方式
GB/T 7714
涂丹丹. 互联网服务排名优化关键技术研究[D]. 北京. 中国科学院研究生院. 2011.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace