欢迎访问澳门新葡亰553311b-所有平台网址大全公司网站!


最新文章

MENU

预测用户的广告点击概率.png

点击: 99 次  来源:http://www.freshstuff.cc 时间:2019-12-07


腾讯在Spark上的应用与实践优化图文百度文库
http://wenku.baidu.com/link?url=8J5hg6ASRnyNfJSsALxKKt1QaKO7oHVwRO8sCGDbyYdPHGDl-oj4xydKsy83F_uTtNIeR4WJPcMgCz3QT9Ky1T-Noej0_mk2-jAtbA0pDlS

图片 1

Case 1:预测用户的广告点击概率.png

图片 2

Paste_Image.png


搜索广告那点事儿:为什么要预估点击率 - 百科教程网_经验分享平台[上学吧经验教程频道]
http://www.shangxueba.com/jingyan/750069.html
背景
想到这个题目是因为 @lijiefei 某天跟我说他有师弟面淘宝时被问到 "点击率预估的目标到底是什么", 笨狗当时胡乱扯了一通, 发现要把这个似乎已经是真理的事情掰清楚还没那么容易, 于是有此念想写文一篇详细分析下原因

我和 jiefei 认识是在百度做搜索广告的时候, 那就从搜索广告开始说为什么要预估点击率, 以及预估点击率的目标. 先申明一些名词和假定: 1) 每个广告 (Ad) 有一个出价 (Bid), 并有其在某情形下实际的点击率 (Click-Through-Rate, CTR) 2) 广告按点击收费 (Charge per Click, CPC), 下面我们会分别讨论一价计费 (First-Price, FP, 即广告出价多少则一次点击计费多少) 和二价计费 (Second-Price, SP, 即广告按下一位出价来支付点击价格, 更普遍的是 GSP) 3) 千次展现收费 (Cost Per Mille, CPM, 或 RPM, R for Revenue), 即对点击付费广告其展示一千次情况下的收入 (一价计费下等价于 1000CTRBid), 或是展示广告的千次展现固定价格 4) 预估点击率 (predict CTR, pCTR) 是指对某个广告将要在某个情形下展现前, 系统预估其可能的点击概率

目标分类
搜索广告跟自然结果一个很大的区别就是自然结果只要有一点相关就应该放到所有结果里去, 至于先后位置那个再说, 而广告, 是有个相关性的准入门槛的, 不相关的广告出价再高, 丢出来还是会被骂死. 那怎么判断相关? 用户会用鼠标点击来对结果投票, 相关的广告会被点击, 不相关的广告不会被点击, 那很自然就能得出 "点击率和相关性正相关" 这个结论 (至于描述里写 "二十五岁以下免进" 但实际是钢材广告的这种诱骗行为后面再说怎么处理). 那对于这种相关性准入的场景, 预估点击率就是预估广告是否相关, 最朴素情况下这是个二分类问题, 那不管预估成怎样, 只要有一种分割方法能分开是否相关就行了. 此时预估点击率的目标是能对广告按相关与否分类 (或说按相关性排序并给出一个截断值). 评估分类问题好坏, 一般都是看准确和召回两个指标, 用人工打分的记录来做回归验证就行

总结

  1. 点击率预估是为产品的最终目标服务的, 最终目标可以是广告的收入, 广告的相关性, 推荐的接受率等, 看具体场景 2) 点击率预估的直接目标根据需求场景不同, 分别是保证预估值和实际值分类正确, 预估序和实际序正确, 预估值和实际值是等比缩放的, 预估值等于实际值 3) 要保证离线评估点击率预估的效果, 分别可用分类的准确率和召回率, 排序的 AUC, 带权排序的 wAUC, 相似度 MAE/MSE 来评估
    (原文:http://www.yewen.us/blog/2013/05/why-predict-ctr/)

广告点击率预测 [离线部分] - quweiprotoss的日志 - 网易博客
http://quweiprotoss.blog.163.com/blog/static/4088288320144810567471?utm_source=tuicool&utm_medium=referral
广告点击率预测(pCTR Predict Click-Through Rate)是广告算法中最核心的技术了。pCTR要解决的问题是预测特定用户在特定广告位对特定广告当特定环境下的点击概率。为什么pCTR如此重要,因为广告排序的核心是eCPM = pCTR * CPC,CPC是广告主对点击的出价,是个已知量,所以只有一个pCTR变量。当然在实际中不可能是如此简单的排序公式,比如还有质量得分(Quality Score),比如Google的质量得分因素。
pCTR一般是从离线数据中学习得到的,离线数据是保存到类似Hive的分布式数据库中,通过机器学习的算法将Hive中的数据进行分析,得到一个pCTR模型,这个模型就可以预测pCTR了,大致流程就是这样。