订阅邮件推送
获取我们最新的更新
我先大概介绍一下。友盟加是今年年初有阿里巴巴收购的3家公司组成的,分别是友盟,CNZZ和DN。这3家公司实际上是中国业界做互联网统计和移动互联网统计领先的3家公司,所以这3个数据体量加起来也非常大。一会我也会介绍到。那阿里收购这3家公司主要是为了丰富她自己的数据内容。因为阿里是强电商数据,但是对于用户在电商场景之外的一些数据,并不是特别清楚。所以我们是帮助阿里去知道,在阿里买东西的这些人,他们平时去哪些网站?看什么内容用什么app?我原来是在CNZZ,然后成立以后我在这个公司做CDO,整体负责数据业务,为什么做风控呢,跟我个人的经历相关,因为我原来在美国工作了5年。所以我想有这些数据的话,我们可以在风控上做一些尝试,我们在年初做了些尝试。后来效果,我觉得还是不错的。所以今天为大家分享一下。
主要是一些结果,因为实际上我们用的用户行为数据。这个可能跟一般的风控的不太一样。因为你讲整个风控的时候,我们说风控数据的金字塔,那最上面肯定是信用相关的数据,你借还款的记录。那下面是一些消费数据。芝麻信用,是跟消费数据非常相关的。那再下面是通讯跟社交,在很多p2p公司自己做风控的时候。他们会去查查你的通话记录,实际上,他们会把这些数据叫做风控里头。最底下是行为数据。这个实际上是我们拥有的,我们应该是中国体量最大的行为数据。那这个金字塔越往上,跟风控的相关性是越强的。那越往下其实它的覆盖率越高。尤其是在中国金字塔顶端的数据,它的覆盖率还是不够的。它覆盖的很多人群其实也不是普惠金融去借钱的这些人群,所以说在这个群体中我们认为下面的这个数据起的作用会更大。我今天讲的结果基本上完全基于行为数据,所有的结果都是基于行为数据的,我们现在是监测中国110万app,那基本上头5000名app,超过60%的市场占有率。我们监测超过600万家的网站,每天收集的线上线下数据一共是260亿。在双11当天,我们有一个广告监测的产品。双当天我们监测的广告投放的资金是34亿,实际上,按投放量来说的话,可能还需要乘10到20。那么每天可以触达的我们称之为独立活跃的设备,是14亿设备。基本上中国的一个正常的手机,我们在这里面都能看到数据。如果看不到数据。其实还是说明问题的。我们的数据其实包括这几方面,一个是app的使用数据。app的启用关闭,访问时长,等等。网站使用数据,网站浏览内容,设备相关的信息。基于这些信息。我们打了行为标签,另外还包括地理位置信息。这些数据其实收集起来,最重要的是要把他相互连接。连接起来之后,我们会通过人口学的信息进行一个判断,因为这些行为学的数据,你不太可能去判断他是男是女,或者年龄段,但这个好处是我们后面是阿里,所以阿里有很多真实的人的数据,我们可以拿的这些数据做模型去训练。用模型,我们可以去做一个预测判断,因为我们的训练量非常大,所以预测结果还是比较可信的。行为数据包括线上和线下的行为,我们现在已经开始收集一些wifi的数据,这样更丰富我们的数据场景。另外我们会做一些人物的关联,人与物,人与世界,人与空间,人与时间,人与人之间的一些关联。这些实际上是通过我们的数据挖掘。把这些关联起来。关联起来之后我们有很多场景。当然这个其实用的更多的是广告场景。现在我们是用的风控的场景。还有一些其他的特征,这都不说了。
...
实录全文请详见附件。