数据饥渴症的时代,养出庞大的巨兽
数据是新时代的石油,在大数据成为显学的这几年,相信很多人一定都听过这句话,但假如你不是创业家或 IT 人员,听在耳里可能没有什么感觉,直到 Facebook 与剑桥分析(Cambridge Analytica)的数据丑闻案,才让大众体认到数据原来真的有价,而且是极为值钱,一直以来,用户习惯使用各种互联网服务,而且以为大多数都是“免费”使用,但事实上,是用户以个人的数据作为交换,支付给这些科技互联网公司,苹果CEO库克在 2014 年就曾说过:“这几年,互联网服务的用户开始意识到,当一个线上服务是免费的时候,你不是客户,你是产品。”,这句话从此变成解读互联网经济模式的至理名言。
数据饥渴症的时代,养出庞大的巨兽
在 1980 年以前几乎所有的数据都由企业创建和管理,后续随着互联网、智能手机、移动互联网普及,大多数的数据来自于个人使用,包括社交、娱乐、线上购物等,在全球拥有超过 20 亿用户的 Facebook 已经成为全球最大的数据经纪商。
图|近年来全球数据快速增长
当 Facebook 数据事件爆发后,很多人都十分好奇自己帐号资讯的使用状况,其实 Facebook、Google 都有提供用户下载数据副本的服务,而 DT 君也下载了自己的 Facebook 数据副本,里头详细记载了个人资料、曾经的发文、上传的照片、影片等,这些都属正常,比较令人好奇的还是在于有多少广告主拿了个人资料,DT君很快速的算了一下,大概有200个广告主取得了我的联络资料,其中不少我从未听过或接触的,更特别是出现了几位美国政治人物的名字,令人感到十分不解。
其实默默在纪录用户一举一动的不只 Facebook ,其他如 Google 、亚马逊、苹果、阿里巴巴、腾讯等科技巨头,一样都拥有庞大的用户数据量。为什么几乎所有的科技公司都像患了数据饥渴症般,止不住抓取用户数据的瘾,因为这些数据能为他们清楚画出用户的样貌,套句警察在调查嫌疑犯的术语—人物侧写(profiling),从你的过去行为推论出你的喜好、性格、甚至是未来的行为。
举例来说,电商公司或网络影片平台分析你的购物历史,再推送能吸引你注意的广告到你的眼前,透过此种“大数据”分析的方式,来撩拨大众的购物欲望不算什么问题,但是,此次 Facebook 事件之所以如此震撼全球,就在于这些数据很可能帮了有心人士的大忙,例如企图左右用户的价值判断,影响重要选举,就像剑桥协助川普竞选团队一样,这就将数据以商业利益为出发的“应用”,变成了以操弄人心为目的的“滥用”,这可就把问题拉到了一个令人心惊的层次。
数据分润将成新商业模式
剑桥分析事件只是数据滥用的冰山一角,换个角度思考,此事件还是有些许正面效应 - 让大众关心个人数据是如何存储和使用,并且未来要把它交给这些科技公司时应有更谨慎的态度,另外,很重要的是,大家都明白了数据的价值。
许多Facebook用户感到愤怒,是因为这些Facebook将个人资料提供给第三方业者,借此大赚获利,不过,如果这些公司将赚来的获利分给用户,情况是不是就会变得不一样?假设这些企业清楚告诉你,如果你愿意分享个人数据资料,就可以得到利润回馈,那么你是否愿意出售个人数据来赚钱呢?
图 | Facebook CEO 扎克伯格在国会听证会上
前剑桥分析商业发展总监 Brittany Kaiser 曾公开表示,“数据是比起石油更为值钱的资产”,甚至直言“科技公司则已成盗贼,窃取用户财产”,并且呼吁Facebook应改变营运模式,把部份从新的数字石油所赚取所得的利益回馈给资料拥有者。
虽然作为剑桥分析前员工的Brittany Kaiser其实没什么立场抨击Facebook,因为剑桥分析同样是滥用数据的一分子,企图影响美国总统大选,她的言论听起来更像是为前公司开脱,或是刻意要把Facebook打到不得翻身,不过,Brittany Kaiser提出把从数据赚来的获利回馈给民众,指的就是上述的数据分润概念。
传统的数据买卖生态链中主要三个角色:一是数据供应商,能够收集到用户数据,二是数据买家,如大数据公司,商家或研究机构,三是数据贡献者,像是用户,消费者.DT君认为,既然数据这么有价值,那么“数据分润”非常可能成为一种新的商业模式,并且基于两个概念之上:“还权于民”,也就是用户可以决定自已的数据怎么用,例如要不要贡献数据,要卖给谁,以及“还利于民”,将数据创造的利润回馈给用户。
在区块链出现之后,不少初创公司投入了基础区块链技术的数据市集,像是国内的公信宝,香港的量数币和数据等,加上数据丑闻事件的推波助澜,让用户做自己数据主人的新商业模式获得了高度关注,而且正在发展成形。
区块链下的数据市集(Data Market)
量数币联合创始人黄何接受DT君采访时指出,一直以来,数据行销(Data Marketing)领域存在两个很大的问题,一是用户为了不花钱使用服务或产品,只好妥协交出自己的数据,业者收集了这些数据,再回头向用户投放广告,“其实用户对这是有感知的,虽然他不知道谁把他的资料卖了,但用户感受往往不太好”。
二是在数据交易(Data Trading)领域存在很多的数据造假,“水军数据,数据供应商跟你说有100万样本,但其实可能只有10万,数据买家也没法查证。”这样的互动关系造成彼此的不信任。
在传统数据领域,匿名和溯源(traceable)是矛盾、不可并行的,但区块链的诞生解决了这个痛点,区块链清楚纪录了整个数据交换、交易的流程,所以封锁了数据造假、灌水的可能,同时,区块链的匿名性能保护用户,誰也看不到贡献这份数据背后的人是谁,对数据买家和用户都是保障。
以用户“匿名”数据进行市场趋势分析
黄何与团队在多年前就推出了一个基于电子邮箱协议的通讯软件—简信(MailTime),强调的是 Open Messenger 概念。什么 Open Messenger?例如,你只要有对方的 Email ,就可以写信给对方,不管你们用的是腾讯邮箱、 Gmail 、还是 Outlook ,另外,传统的手机SMS信息也是支援跨电信网络互传,当你想发个手机简讯给朋友,不管你们是不是使用同一家电信运营商的服务,只要输入电话号码,对方都能收到。
但是,现在我们使用频繁的通讯软件,不论是 WeChat 、 WhatsApp 、或是LINE等通讯软件,都限定只能传讯给使用同样软件的人,而不能跨平台互传,例如 WeChat 用户就不能传给 WhatsApp 用户。
因此黄何团队开发的 Open Messenger ,融合了 Email 的开放互通性,并结合了类似通讯软件方便、快速的使用体验,用户可以把自己多个Email帐号聚集到简信底下,并且可以类似发短信的方式,快速与他人联系、互动,这个概念获得了不少肯定,让他们在2014年成为第一个打进 TechCrunch Disrupt 创业竞技场的华人团队,也被获选进入矽谷知名的加速器Y Combinator。
目前简信在全球累积了 500 万用户,市场以欧美为主。在累积了不少用户后,他们新的目标就是切入区块链数据交易领域。他们以简信作为收集用户“匿名”数据的平台,再透过自家开发的大数据软件,分析这些数据,例如邮件会收到很多的线上购买的确认信,就可以基于此分析出行业趋势、洞悉消费者的报告,例如游戏点数消费、APP购买、电子产品购买等。
购买这些报告的客户就是使用“量数币”来支付,而“愿意”贡献数据的用户也可以获得量数币作为回馈。而量数币則是建立在以太坊(Ethereum)区块链技术之上,所有参与的交易都将采用智能合约来实施,每一个数据点的价值都是按照公平的原则所计算出来,让用户获得合理的收益。预计在今年第三季就会开始实施数据采集、分享的区块链交易服务。
图|量数币平台经济分配
目前做消费者的大数据分析可简单分为两类,一是聚集体(Aggregation),就是将用户的资料聚合,从整体中看趋势,例如购买行为分析、收视分析、游戏用户分析等,这种概念类似市场调查公司AC Nielsen,不过传统市调公司使用的调查方式多半很传统,如填问券、做街访等。而这一类以群体为出发的市场洞悉研究,通常不需要采集用户的个人可识别信息(PII,Personally Identifiable Information)就可以做。
另一类就是做用户侧写(User Profiling),搜集用户个人的习惯、消费记录等数据,描绘出这个人的样貌,进而对用户投放广告或服务,例如电商公司或是 Facebook 。这种模式往往就会涉及个人的数据及隐私问题。
因此,“ Aggregation 是聚焦在『面』上,Profiling则是聚焦在『点』上,”黄何举了一个清楚的例子。为了避免涉及用户的 PII 信息,量数币做的是 Aggregation 概念的大数据分析,也就是聚焦“面”而非“点”。
量数币的定位是打造一个基于区块链的大数据价值经济生态,在这个新型的经济生态中,数据买家可以买到“不造假”的数据来源,同时,用户能够清楚知道自己所贡献的匿名数据的价值,并从中获得相应的回报,如此才会形成一个良好、公正的合作关系,而不像Facebook与剑桥分析隐匿了数据的应用,引发了用户的怒火。
而用户贡献了数据可以获得多少报酬呢?黄何表示,这取决于市场需求和供应量。举例来说,一款很火游戏的市调分析,大家就会很想看,市场需求就很高,用户贡献的数据可以被多次使用,分到的利潤也就增加,但是,也因为这款游戏很多人玩,很多用户都能贡献数据,数据的稀有性就不是太高,价值也会受影响。反之,如果贡献的数据是比较稀有的,但市场需求很大的,如此获得的奖励自然就会很好。
另外,他也强调,量数币团队不会在交易中间收分润,因为该获得价值的是贡献数据的人。不过,要营运区块链网络,还是有软硬件基础设施的成本,所以只会收取小额的营运费。他们着眼的获利来源会在于行业报告的价值,客户是使用量数币来购买分析报告,但代币是有限的,只要未来报告的价值被更多人认同,很多客户想买,那就得用比较高的价值来买代币,到时团队就会获得比较好的报酬。
图|量数币联合创始人黄何(前排中)与团队 图片来源:量数币提供
被腾讯“致敬”了,创业故事即将登上荧幕
黄何对数据领域相当熟悉,原因要从7、8年前谈起,那是微信还没问世的年代,在 2011 年有一个爆款 APP — Talkbox ,以一按就通话 Push To Talk 的特色,掀起了中国语音聊天的风潮,当时 Talkbox 的核心创始团队里,黄何就是其一。Talkbox 因为非常受到欢迎,腾讯还一度有意收购 ,后来雙方交易没成, Talkbox 反倒还被小米、腾讯给“致敬”了,米聊增加了语音功能,腾讯也推出了微信。
大型的科技公司挟其资源及用户量体庞大的优势,一点一滴瓜分了 Talkbox 的市占率,既然 Talkbox 的用户群聚网络效应已经不再,团队只好另辟战场,选择再度创业,成立了简信MailTime。
没想到,这段已经打过美好一仗的岁月,居然吸引了网友关注,甚至还以此为架构,写了一部改编小说,“我们自己都不知道创业被写成小说,一直到前阵子小说要拍成电视剧,制作公司找上我们才知道,”黄何笑着说。这部緣起於 Talkbox 、以互联网创业为背景的电视剧《创业时代》,由 Angelababy 担任女主角,预计今年下半年就会上映。
什么数据看起来最有价?医疗!
大型互联网公司爆发数据丑闻,使得全球开始注意到个人数据的保护,但相信不论是有意或无心滥用用户数据的绝对不只是Facebook一家,因此以区块链为基础的数据交易平台,在安全性及分润制的驱使下,有很高的机会能吸引用户采用。
不过,大数据就像是淘金,要从庞大的数据量中挖出价值,但并不是所有的数据都是很高的价值,DT君认为,目前看来,医疗健康数据的潜力非常大。主要是因为个人 医疗资料有很高的隐私性,因此医疗行业的监管一直很严谨,不论是医院、学术研究机构、甚至是药厂,想要取得个人相关资料,都必须经过严格的流程及审核。因此,个人医疗资料在取得难易度及研究价值无疑会比一般数据来得更高。
而在资料保护周延的前提下,区块链的数据交易平台能让贡献资料者获得利益回馈,很可能提升消费者或患者贡献数据的意愿,如此一来,研究样本匹配度较高,也有机会能加速各种疾病的研究、新药开发等。
例如遗传学大牛、哈佛大学教授 George Church ,就在医疗行业倡议了“数据有价”这件事,由 George Church 共同创立的 Nebula Genomics 的基因测试公司,在今年初就提出一项测试项目,计划以 999 美元完成全基因组测序,消费者可通过分享基因资料获取加密货币,就是利用分享基因资料可赚钱的诱因,来吸引更多的人贡献基因数据,进而加速整体行业的研究脚步。
另外,以生成对抗网络(GAN)来开发新药的初创公司Insilico Medicine,也发表了一篇论文《Converging blockchain and next-generation artificial intelligence technologies to decentralize and accelerate biomedical research and healthcare》,来阐述一个基于区块链架构的医疗数据交易平台的创新概念。他们利用 AI 打造了一个价值模型,会依照用户贡献的数据内容、时间等参数,评断出数据组合的价值,当医药研发公司或研究机构想要使用这些数据,就会依此来估算费用,这些钱则会回馈到用户身上,同样是利用区块链进行医疗数据交易的一个案例。
有许多业者不愿意公开、甚至隐瞒收集用户数据的事实,使得用户与服务商之间的信任关系渐变得不牢固,用户开始意识到自己正在无偿贡献自己的数据,而且不知道数据的流向及隐私是否被侵犯,因此越来越多人拒绝Cookie网页追踪或是分享数据,另一方面,欧盟的个人资料保护法GDPR已经上路,条例里载明了许多业者对于搜集、使用消费者数据的严格规定,这些都让大数据行业正在出现变化,最直接的影响就是数据资源正变得越来越难取得,不过,区块链的技术透过安全、透明的运作架构,让一般大众能够拿回数据的主控权,无疑是另一个更重要的变化。
© 2017 Coolsite360-上海意派 All Rights Reserved.