第五章 大数据和算力的结合(上)

换源:

  酒席散后,安奈拉着肖战打车去了一家咖啡店。

人们都觉得咖啡店是一个谈事的好场所,还能临时办公和上自习。可肖战不喜欢来这里,他不喜欢里面打磨咖啡豆的噪音,觉得是一个糟糕的地方。

“到底是怎么回事?”肖战还没有喝咖啡,酒就醒了,但是还一脑子迷糊,自己怎么就参与到这么一个不伦不类的农业项目,还认识了这些不明不白的人。

“听我和你说。”安奈带着肖战过来,就是要把下一步的事情说明白,“今天你看到那个萧律师了,她的全名是李萧玉。她不仅仅是法务部的律师,还是这次数据合作中笛得方的主要负责人。而那个李部长,其实是挂名的,负责具体的执行。”

“为什么找个律师当负责人,还负责这么重要的项目,她懂什么,就靠那些法律?”肖战一下子觉得这里没有法律什么事情,还想起来萧律师敬酒的时候说的那些活,感到很蹊跷。

“农业项目是一个幌子,是给媒体看的。实际的项目是迪德公司里的用户出行数据在天湖上应用。但这些数据里面包含了大量的用户隐私,这种合作很难拿到台面上交易,法律风险太大,所以需要法律专业人在里面做风险控制,或者说是做合规,再说的赤裸一点,就是让这个合作不出事。另外,这个萧律师本来就有互联网数据和产品的业务背景,所以既然我们双方以法律风险为第一考量,就都认可了她的位置。”

“就是保证我们和笛得的合作不会犯法,那我明白了。”肖战也隐约的有些疑惑这么用数据是不是合法。但是既然找来了律师做把控,自己就放心了。他并不相信律师能解决这个数据使用的合法问题,但是相信有律师在,如果出事了,她能找到背锅侠,让其他人去承担这个责任和后果。

肖战突然明白了,有人去解决其他方面的事情,天湖的数据应用之路终于可以开始了。

从没有哪个时代像现在这样,大家把自己的东西都放在公共空间,或者说交给一群陌生人去保管。互联网出来之前,人们的户口和房产这些隐私信息,都是由政府的部门管理的,在一个封闭的空间内相对是安全的。而人们去商店买几次东西这种小事,商店也不会记录这个人都买了什么。也可以说,那个时候人们的社会生活,很多都是匿名的,谁也不知道也不关心你去了几次这家商店、逛了几次动物园。互联网看似自由,但上一个网站得先注册一个用户名。这下子可好了,你访问了多少次这个网站、在里面干了什么,他们都知道了。顺其自然的,网站就开始分析你、琢磨你了。

人们在互联网产生的每一条数据,背后都是活生生的人生片段:

一个化妆品订单,是一次对美的追求,或仅仅是让自己足够得体;

一份聊天记录,是一段缠绵,或是一次激烈的争吵;

一段出行轨迹,是一次旅行,或者是一次逃亡。

生活中还有多少事情,可以不在互联网上记录呢?打开手机,所有的操作就都被记录了;即使手机放在口袋里面,可它还是如影随形的记录轨迹;好不容易来到饭店,放下手机要吃个饭,还得团购一下打个折、拍一个相片分享,生怕互联网忘记了这顿饭!饭店服务员还让你在团购的APP上写一段上百字的感受,加上几张图片,给个好评,当然奖励是打折或者送一个小礼品:这就是出卖了隐私的价格。

每一类生活场景的数据都仅仅在一个互联网公司里面,有的是购物、有的是聊天、有的是导航,我们就感谢这些公司的贪婪和自私吧,每个公司都不愿意把这些数据分享出去,才暂时保护了我们网民的数据不被充分整合分析。

两个公司要想整合数据,是非常复杂的事情。首先要做的事情就是把账号进行匹配:做聊天APP的公司想知道用户在其他购物APP里面都买了什么,得找到用户在那里的用户名。而更复杂的是谈价格,自己的聊天数据能换取对方多少购物订单数据,是一个始终谈不拢的问题。拿到桌面上去谈判用户的隐私数据的交易,都担心对方留了证据去举报。双方互怀鬼胎,这样的谈判是极其复杂的博弈过程,等双方都满意了、都认为安全了,数据也就都过时了,所谓的整合还有什么意义呢!

“所以,我们就直接启动,没有时间和精力考虑其他的。法律的风险让律师去应对吧。”安奈接着说,“这个农业项目本身,虽然不是重点,但至少在牌面上,对我们安迪尔、迪德、国金和政府来说,都是一个不错的项目。项目资金由国金去考虑,业务其实是迪德在做,政府做背书来帮助协调资源,大家各有所需。我们安迪尔临时成立了一个农业数据部门直接参与,你不用管这个业务,但你的公开身份是在农业数据部门,方便你以这个身份和迪德进行沟通。”

“但是国金公司和政府知道这些吗?”

“他们必须不知道,这是核心机密。他们也不想知道,就算是私下里面知道了,也会装作不知道。”

“为什么会这样,装不知道?政府不需要监管吗?”肖战只懂技术。

”如果那个董处长知道了,其实他根本不知道怎么处理,毕竟这是一个复杂的新兴事物,法律规定还不明确。处理不好就是自己的责任,如果不处理肯定是失职。所以,不知道是最好的。如果出了问题,那是这些企业的违法行为,由企业来承担责任。他们都不想惹这个麻烦!”

“董处长在饭桌上聊了很多个人数据安全的问题,说明他自己是懂这些的。”

“对,这些东西他当然懂。但只是个人的事情,没有带到工作里面。而且我会想办法让他闭嘴。”

“那我就安心的研究数据和算法吧。”肖战不想考虑外面太多的事情,只要有了数据,他就又能回到天湖的世界中。

“关于与笛得的合作,笛得是想让我们用天湖系统帮它分析用户的行为,进而提高市场份额。”

“好,我们也是要分析这个!”

“你的任务,是把笛得的数据拿出来放到天湖里面。而且要持续的数据,就是时时保持同步最新的数据。笛得的用户量很大,是主流的地图APP,这些对我们太重要了。”

谁愿意告诉别人自己的出行轨迹、家庭住址和工作地点呢!这些事情对于身边的人来说都是隐私,何况怎么可能愿意告诉陌生人、告诉一个什么公司呢?

可是这些互联网公司,投入资金进行研发数字地图和导航产品。他们这么做的目的是提供出行服务,并不是特意的收集人的轨迹,但这是一个结果。

地图APP都是免费的,但人们总是忘记,购买这些服务的不是钱,而是自己的信息和隐私。

一个迪德的地图APP,就完整无遗漏的记录了人们的出行。每天的固定通勤,就泄露了家庭地址和工作的地址;每一次导航和打车,就暴露出要去做什么。APP不会休息,默默的记录着真实的生活轨迹。

“迪德也是一家技术实力很强的公司,很多应用自己都可以做。那天湖能给迪德带来什么独特的价值呢!”

安奈稍微思考了一下,“说实话,技术是一方面。但更关键的是一个数据平台的效应。我们要迪德的数据,迪德也要我们的数据,因为它缺数据。”

“迪德缺什么数据?出行的数据都在它那里啊!”

“它当然不缺出行数据,但是它没有其他互联网公司所拥有的数据,它不知是用户们在聊什么、在网上买了什么。迪德需要这些数据来了解用户,丰富自己的应用。”

“那我们天湖现在也没有这些数据啊?”

“慢慢会有的。我们还会和其他互联网公司合作,获取他们的数据,然后会和笛得分享一部分。”

肖战有一种做了中间商的感觉:天湖通过提供算力,换来核心互联网应用的数据,进而产生了虹吸效应,吸引了更多的互联网公司过来。天湖成了一个数据超市、有垄断地位的中间商!

算力可以买,但是别人的数据买不来。这些互联网公司真的仅仅在乎天湖的算力吗?

肖战有点迷惑,但他不想再考虑这些了,先把数据弄到手。

肖战接着说:“我们和每一家互联网公司都这么合作,就有了所有的数据。最高的分析权限在我们这里,给别人多少也是我们说的算。有了这些数据作为基础,我们除了能分析人,还能造人,用天湖大模型来造人!从真实的人类行为数据中学习,生成逼真的定制人类:在互联网上,没有人能够区分哪个是真实人类,哪个是定制人类。”肖战开始畅想!

“我们任重道远,这些我们都会做的。我们的现阶段任务,就是全面汇集数据。但这个过程是会很曲折的,例如这个迪德,它的用户数据肯定是有加密的,或者是匿名的。这样,笛得才能把数据交给我们,这也是萧律师要把关的地方,否则法律的风控这一关过不了。所以我们就得重点考虑解密的事情。”安奈相信这是可行的,但具体的方案还得肖战深入笛得之后才能出来。“这个解密的过程,也要看你在笛得的掌握的信息了:需要非常规的手段来配合。”

“还要当间谍吗?”肖战笑了。

读书三件事:阅读,收藏,加打赏!