精(惊)准广告!

隐私护卫队
2019-01-17 18:26

年关将至,刘明正计划和家人去日本大阪旅游。他的家人通过微信发来一张春秋航空机票的截图,称“春秋去大阪可以”。8分钟后,一件令他诧异的事情发生了——一个微信公众号推文的底部广告位,出现了大连到大阪的春秋航空机票广告。

这是一个巧合,还是一次精准的广告推送?如果是广告,广告商是如何在短短8分钟内,得知用户的操作行为并完成精准推送的?

和刘明一样,江江也有相同的困惑。不久前,他跟妻子商量着给孩子买钢琴,便在聊天记录中贴上了某品牌电子琴的淘宝链接。隔天,朋友圈广告竟然出现了这款电子琴。

信息时代,广告无处不在,你我或许都面临过这样的疑惑:明明只是在电商平台上搜索过某商品,打开另一款资讯App,却看到相同的广告。

种种贴心推送,真的只是巧合吗?

被一只“壁虎”打断的线上聊天

与刘明、江江相比,侯先生的广告体验似乎更惊奇些。

2018年12月10日,他在和同学聊天,刚用安卓手机的搜狗输入法打出“奥迪”两个字,手机屏幕突然闪出一则动画广告。

广告中,一只灰色的“壁虎”拖着长尾巴从屏幕左边快速窜出,向上冲破“Audi quattro”字样,并在稍作停驻、张望了一眼后消失。紧接着,奥迪的标语和LOGO渐渐清晰了起来。

一场私密的对话,被一只突然造访的“壁虎”打断。它霸屏的时间前后不过5秒,却让侯先生许久没缓过神来。

“这是根据我输入的信息,读取了我的聊天记录吗?”他觉得太可怕了,“感觉自己的隐私被粗暴侵犯了。

疑惑、困扰、震惊……互联网广告之精准,带给用户的体验或许远不止这些。尤其是人们的网络行为轨迹和真实生活发生交集时,这种“有人比你更懂你”的不安情绪更为强烈。

人们的不安情绪还来自于,和朋友线下聊天讨论“西餐厅”“草莓”“狗狗玩具”,App马上给你推送西餐等相关的广告和资讯。

此前,曾有外国小哥做过直播测试,试图验证谷歌是否通过麦克风“偷听”用户的谈话内容,然后用于广告投放。结果显示,他反复说了狗狗玩具的话题后,几分钟前才浏览过的网站,开始给他推荐这类商品。

同一网站页面,在小哥的一番聊天和浏览之后,出现狗狗玩具广告。

2018年年初,今日头条也曾遭到类似的质疑。对此,今日头条回应,它无法收到用户的任何语音信号,除非用户点击授予麦克风权限。今日头条用户信息的积累,完全是在严格遵守相关法律规定的前提下,通过用户在今日头条的点击等数据行为产生的。

有业内人士认可了这样的解释,并指出,以业内目前的语音信息处理水平,还达不到通过麦克风去获取个人隐私的程度。收集大量的语音信息,并在短时间内做运算分析,基本不可能。

尽管没有直接证据说明网站或App确实“偷听”了用户的隐私,但可以肯定的是,这些个人信息一旦被泄露或滥用,就会给当事人带来财产和人身的巨大危害。

茫茫人海找到你,精准广告成爆款背后的推手

基于用户信息的个性化推荐,在行业内有个统一的名称——程序化广告。

这是一种利用技术手段进行广告交易和管理的广告形态,它的核心是:在正确的时间和场景,通过正确的方式,将正确的商品展示到正确的用户面前。

事实上,许多产品的爆红背后,都有精准营销的助力。

2018年9月中旬,一档刑侦题材的青春电视剧在东方卫视和浙江卫视上星播出,首周收视率不佳,面临撤档风险。而一旦撤档,不仅是这部电视剧受影响,出品方后续的经营业绩也会被波及。希望扭转颓势的出品方,找到了 Sandy 所在的广告公司。

从业超过十年的Sandy 很快和团队确定方案:在微信朋友圈和今日头条投放广告。

在广告市场中,掌握了大量用户数据及其网络行为的大平台,比如腾讯、微博、今日头条,日益受到广告主的青睐。Sandy的经验是,不管是广告主有明确的短期目标(如新产品或活动上市),需要冲销量、提升收视率,还是广告主有长线需求,想提升品牌的消费者黏着度、增加重复购买的可能性,都会倾向于在这些平台投放精准广告。

然而茫茫人海中,如何精准抵达目标人群呢?

这首先需要进行用户的识别。据隐私护卫队了解,PC端通常用cookie作为人的唯一标识,为每个“人”打标识的技术,在业内被称为“种cookie”,它的主要功能是实现用户个人信息的记录。移动端用的是唯一的设备号ID,Wi-Fi上网设备则通过手机无线网卡的MAC地址标识用户。

基于cookie和设备号ID,用户的浏览偏好和广告行为被收集和标记,然后被打上一个个标签,形成用户画像。

“这些标签有些是反映用户的静态属性,有些则与用户的动态属性有关,反映他们一定时间内的偏好和需求,”舜飞科技高级副总裁梁丽丽告诉隐私护卫队。

在她撰写的书籍《程序化广告》中提到,标签一般包括用户性别、年龄、行业、收入、婚姻状态、教育背景、兴趣爱好等。这些数据或出自广告投放者的自有标签,或来自第三方的数据管理平台。

这幅插图形象地说明了用户画像是如何随着用户的使用行为被逐步构建出来的。图/《braze》杂志

回到 Sandy 的案例,结合电视剧题材,她圈定 TA(广告行业中的术语,Target Audience,意为目标受众),并总结出对应的标签词,比如男性。

在广告投放后台选定标签词和付费方式后,Sandy 和团队上传推广素材。等待一段时间,就可以查看反馈数据,具体的类目包括触达人数、点击率、停留时间、转化率等。

为了争抢观众,Sandy还将浏览过同期其他热播电视剧资讯的用户纳入推广范围。

“有人在 QQ 资料里自称是20岁的少女,但实际上‘她’可能是个猥琐大叔。” Sandy告诉隐私护卫队,“我们都可能在公开场合呈现出一个外在人格,但在网络上浏览了什么、搜索了什么,是没法骗人的。

她总结,触达用户是基础。“有了大量的触达基数,才能接触到可能感兴趣的人。下一步就是针对非常感兴趣的人,做进一步的优化。”Sandy 回忆道,为了匹配用户的兴趣,团队制作了多套推广素材。以今日头条为例,不同的TA用户可能在新闻信息流中看到亲情、爱情、兄弟情等不同主题的片花广告。

两周的投放收效明显,该剧的收视率很快冲进全国前三,并保持稳定。 

淘宝真的会和京东共享我们的标签吗?

不久前,一篇《大数据之下无隐私》的微信文章,在朋友圈刷屏。作者肥肥猫提到,他在淘宝和京东分别搜过一种特别小众的商品,结果打开拼多多,首页推荐的就是同款商品。

究竟拼多多是如何知晓其淘宝和京东的购物偏好的?是平台之间共享数据,还是内鬼兜售、数据库被黑,抑或是手机厂商搞鬼?肥肥猫称:“百思不得其解,细思极恐”。

背后的原因,可能与程序化广告的商业模式有关。据隐私护卫队了解,程序化广告存在一个类似股票交易的市场,广告的买卖双方都在这里对接。从你打开一个网页开始,到那则让人觉得似曾相识的广告出现在眼前,背后其实有个“实时竞价”(RTB)的过程。

目前市面上常见的广告交易平台(ADX)分为“公共综合”和“私有”两类。前者不拥有媒体资源,只承担撮合买卖双方的角色,比如百度的BES、阿里的TANX、360的MAX等。

后者则从属于主要的媒体方,既有流量又可提供交易平台,比如腾讯社交广告(原名广点通),新浪、搜狐等门户类媒体ADX,或优酷、爱奇艺等视频类媒体的ADX等。

根据广告交易市场的不同,RTB实时竞价也有公开和私有之分。相比之下,公开的ADX的流量较大,但质量参差不齐。私有ADX的流量较为优质,当然价格也较贵。它们更愿意将流量开放给大型的广告主,于是产生了私有竞价。

完成全部竞价环节不过零点几秒,远远超过普通人的想象。这就是为什么你刚刚聊过天,转眼就会收到精准推送。图/hsienblog.com

需要指出的是,不管是何种交易模式,平台间的数据并未打通。

“在交易市场上并没有用户的标签信息被交换或共享。商家相互传递的只是一个需求,就像股票交易市场。例如钢琴商想投放广告,他可能会找到微信、淘宝、拼多多或任意一家平台投放钢琴广告,这些平台会根据自己曾经打上过‘钢琴’标签的用户来推送广告,数据还是属于各个平台自己”,一直从事程序化广告研究的资深专家吴俊告诉隐私护卫队。

法律边界:精准广告会泄露我的隐私吗?

相较于传统广告无差别的广撒网投放,程序化广告更能在合适的场景抵达目标客户,从而提升广告的效率。不过,用户对这样“很懂你”的贴心服务,反映不一。

图/hsienblog.com

“如果推荐给我的广告是我想买的商品,正好省去了我搜索的时间”,熟知广告投放逻辑的梁丽丽说,“但如果在我买过空调后,还一直推送空调广告,就有些困扰了。”

一个更为重要的问题是,这种越发精准的收集和推送行为,是否会侵犯用户隐私,并触碰法律的边界?

搜狗相关负责人对隐私护卫队表示,搜狗输入法中的“智能分享”推荐功能,通过用户终端设备进行计算匹配实现。用户在使用键盘过程中输入的文字内容、个人敏感信息,不会被使用或上传到云端。为保护用户隐私,搜狗采用符合业界标准的安全防护手段,整个数据在传输和存储过程中都是加密的状态。

腾讯也曾就有关话题作出公开声明,称微信不留存任何用户的聊天记录,聊天内容只存储在用户的手机、电脑等终端设备上,不会将用户的任何聊天内容用于大数据分析。

根据《网络安全法》的规定,网络运营者不得泄露、篡改、毁损其收集的个人信息,未经被收集者同意,网络运营者不得向他人提供个人信息。但是,经过处理无法识别特定个人且不能复原的除外。

2018年5月开始实施的《个人信息安全规范》则要求,使用个人信息时应消除明确身份指向性,避免精确定位到特定个人。

因此,个人信息收集、使用的法律底线,在于不能精确定位到特定的个人,不能识别出一个人的身份。这也是目前程序化广告的推广边界——多位从业者坚称,一个由标签组成的用户画像,并不能对应到可识别的真实个人。

据相关研究者介绍,为了避免用户画像与真实个人对应,所有的标签都会被打到一个手机设备ID上,而非手机号码或者身份证等实名ID。

换句话说,如果过程合规,所有的广告都是推送给一个个手机,而非具体的人。“对于我们来说,手机背后是张三还是李四,根本不重要,我们关心的只是这台手机的主人喜欢化妆品还是运动鞋”,某大型网站的工作人员表示。

一个常常被忽略的事实是,手机厂商在保护用户隐私中,承担着重要的责任。

iPhone一般用IDFA码作为广告推送的ID,用户可以随时关闭或清空IDFA码,以此拒绝被追踪。

iPhone 的隐私设置中可以还原广告标识符。

Android目前则还是以IMEI为主。要获取这个设备号,App需要向用户申请“READ_PHONE _STATE”的权限。在Android6.0版本之前,这项权限通常默认开启,现在随着版本升级,用户也可以选择关闭。

基于此,我们似乎可以初步建立一个判断方法:当广告规范地推送给我们的手机识别码或ID,可看做是法律法规规范内的大数据运用,这也是目前国内外互联网重要的盈利方式之一;但当广告推送给我们真实的人,就已经跨过了法律法规的界限。

争议:识别用户画像背后的真实个人并非难事

不难理解,精准营销的本质在于定向。用户画像越全面,广告投放的精准程度也越高。但不可回避的问题是,“通过信息收集勾勒网络环境背后的真实用户,并非难事。”

长期关注大数据法治研究的学者齐爱民告诉南都记者,为了尽可能提升广告投放的精准性,广告投放主体通过加入广告联盟等方式,最大程度上获取用户数据。

即便精准广告的投放以契合用户兴趣、深入挖掘用户潜在消费力为目的,但这并不妨碍平台对用户地址、联系方式等敏感个人信息的收集。大数据使用不当,就有可能涉及用户隐私安全问题。

比如说,你逛商场时不小心连上一个Wi-Fi,广告主可能就知道你的很多秘密。此前有网友爆料,Wi-Fi探针可扫描获取到周边设备的MAC地址,进而匹配到手机号、浏览记录和大体的家庭关系。

这种以Wi-Fi探针技术为基准衍生出的广告营销,已成产业链。

一名网络安全专家向隐私护卫队解释了背后的技术原理。Wi-Fi探针好比将设备对应到人、人对应到数据的桥梁。它只能识别用户所在区域的MAC地址,但通过与第三方数据相融合,比如支付数据、会员数据、线上数据、地理位置等,可分析出详细的用户画像,进而进行精准的广告推送。

一家技术公司给出的推送示意图。图自网络。

2018年8月,浙江绍兴警方破获一起非法窃取30亿条个人信息的案件。涉事的北京瑞智华胜是一家专注互联网营销业务公司。办案民警介绍,通过与正规运营商合作、拿到登录凭证,这些公司利用非法软件自动采集用户cookie、手机号等信息,然后用于精准营销。

除此之外,蓬勃发展的人工智能,也在带来新的挑战。

2018年11月,科技类媒体“品玩”曾报道,有企业正在研发一种智能摄像头和软件系统,可以记录客人每次经过门店的时间点、照片、心情、有无戴眼镜,系统甚至能推测客人的年龄和种族。以后客人到店时,人脸识别系统会自动对比会员信息库,识别出新老用户,提醒店员精准接待。

在商家看来,这套只需3000多元的系统无疑是贴心的营销工具,但从消费者的角度考虑,这很可能是在毫无察觉的情况下,把每个人的隐私袒露在商家面前。

“说到底,精准营销不过是利用大数据技术实现的商业行为。”齐爱民认为,不管是针对手机ID亦或是推送到真实的人,精准营销行为都涉及对个人信息的收集和使用,因此应当适用于网络服务提供者与用户之间关于个人信息保护和利用规则体系。

互联网发展至今,大数据毫无疑问已成为行业最庞大最有价值的资产,流动与使用,则是大数据实现价值的重要方式。是否能兼顾数据流动与个人隐私间的平衡,已成为业界发展最大的挑战。

(来源:隐私护卫队)

(文 | 李玲 冯群星 蒋琳 尤一炜)

(编辑:毕凤至,实习生,郑若岚)