程序地带

推荐那么准,除了模型,还有什么。。。


最近v2ex论坛上出现一篇很热门的帖子《QQ正在尝试读取你的浏览记录》,题目很耸动,结果也很令人吃惊。
简要介绍一下事情的来龙去脉,楼主反映火绒杀毒软件提示QQ正在触发一些规则,QQ尝试读取用户的AppDataLocalGoogleChromeUser DataDefaultHistory等目录,目录中的信息为用户浏览器历史记录。有点东西,随后看雪平台的安全大佬对行为进行了逆向分析([原创]关于QQ读取Chrome历史记录的澄清),其先读取各种 User DataDefaultHistory 文件,读到了就复制到Temp目录下的temphis.db。然后再用SQLite读取数据库,然后“select url from urls”,获取到用户的历史信息域名,至于获取这些域名信息后面的操作已经可以猜到了!

结论,QQ并不是特意读取Chrome的历史记录的,而是会试图读取电脑里所有谷歌系浏览器的历史记录并提取链接,确认会中招的浏览器包括但不限于Chrome、Chromium、360极速、360安全、猎豹、2345等浏览器。
大部分的浏览器都会中招,QQ就这么轻而易举地扒掉了浏览器的“底裤”。
对于后面的结果我不太惊讶,我吃惊于为何手段如此简单。
过去经常有人发出“手机窃听说话、聊天信息导致app推荐如此之准”的疑惑,作为一名算法工程师,我对于推荐的精准一点都不意外,因为基于用户的大量浏览记录、留存于app上的基础信息和目前所在环境信息,这些大量的用户信息在模型的“召回-》精排-》粗排”过后给用户推荐出感兴趣的音乐、视频、新闻并不是一件什么困难的事情。

但是,数据的获取细节,我们可能也不太了解。对于数据来源,我以前的猜想是用户在app上的点击埋点信息以及集团下面的兄弟企业间的信息共享就可以达到我在百度搜索了团建游戏,微信朋友圈就有望京小腰的广告推荐。

只要友商够多,收购的小弟们够多,这种做法理论上是行得通的,也是有效的。但是这种模式相当受限,想让百度、阿里、腾讯进行这种准实时的数据合作相当之难。而且,在技术层面想达到服务间的数据及时共享也得耗费大量人力财力。

直接扒浏览器文件夹,相较于我的猜想可谓是神之一手,不用商务去对接“友商”,不用产品去互啃对方文档,不用技术加班996,只用把文件夹复制一份就搞定,妙!
不过,目前的一些信息也只是两位热心市民的自助探索,到底腾讯对这一步技术操作如何解释,我也相当好奇(吃瓜
最后,提醒各位一句,互联网上无隐私,保护好自己,你偷偷看的东西,还有一群人在帮你分析=。=
 
插图来源:帆咔嚓@FanKetchup
 
微信公众号:正版乔

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/qiaohaoforever/p/14289947.html

随机推荐

娱乐机器人行业:兴于教育,困于教育

娱乐机器人行业:兴于教育,困于教育

配图来自Canva可画看过《澳门风云3》这部电影的朋友们,一定对剧中的机器人管家——傻强记忆深刻。在电影中,能够斟茶、变形、喷火的傻强,让很多人对娱乐机器人产...

liukuang110 阅读(125)

Leetcode217. 存在重复元素(C++思路与代码)

给定一个整数数组,判断是否存在重复元素。如果任意一值在数组中出现至少两次,函数返回true。如果数组中每个元素都不相同,则返回false。示例1:输入:[1,...

azulgrana02 阅读(179)

五个等保等级

一级第一级信息系统受到破坏后,会对公民法人和其他组织的合法权益造成损害,但不损害国家安全、社会秩序和公共利益。自主保护级第一级信息系统运营、使用单位应当依据国家有关管理规范...

少侠且慢 阅读(436)

maven 打包数据库加密_maven项目的搭建以及配置

首先先设置一个本地依赖库,我放在了然后需要在maven中指定之后的项目需要搭建工程,项目的工程如下所示:首先创建一个父工程下面配置pom.xml文件ÿ...

彭澎 Current 阅读(619)

微服务升级优点_微服务系列—架构演变

1微服务基础知识1.1系统架构的演变随着互联网快速发展,网站应用的规模极速扩大,常规的单体应用架构已无法应对大流量,于是就出现了分布式服务架构以及微服务架构&...

weixin_39717598 阅读(145)

JAVA基础学习(十)------集合框架

JAVA基础学习(十)------集合框架

JAVA基础学习(十)------集合框架集合的概念什么是集合概念:对象的容器,定义了对多个对象进行操作的常用方法,可实现数组的功...

钟情_ 阅读(258)