(央视财经《经济半小时》)大数据是这几年一个非常热门的科技词汇,大数据的广泛应用正深刻地改变着我们的生活。2009 年,美国谷歌公司利用大数据模型预测到H1N1禽流感将要爆发,这一大数据应用的成功案例被记录在一本名为《大数据时代》的书中。2013年,该书被引入中国,这本书的翻译者叫周涛,是国内大数据研究领域知名专家,如今他也开创了自己的大数据公司,从专家变成了企业家。虽然都是在和大数据打交道,角色转换后周涛的日子过得怎么样呢?
大数据挖掘是一座富矿 但信息安全却让人忧心忡忡裹步不前
成都数之联科技集团合伙创始人周俊临:涛哥,这个就是个传奇了。
成都数之联科技集团董事长傅彦:他就是一个思维非常敏捷的人。
周俊临:做一件事情非常拼命,比如说有一次做全美的数学建模大赛,周涛带了三个学生差不多整整三天三夜没有休息,获得了特等奖。
傅彦:周涛思路非常清晰,记性也非常好。
周俊临:他一天可以不同批次的合作伙伴,然后他把时间会控制在误差不超过五分钟,当所有人都谈完了之后,晚上他回去做自己的文章,因为他现在虽然在我们这个创业公司,他还是在科研一线,他自己写文章、自己做实验。
周涛,成都数之联科技集团首席执行官,电子科技大学大数据研究中心主任,风靡一时的畅销书——《大数据时代》的中文译者。15岁考入中科大少年班,26岁获教育部自然科学一等奖,27岁瑞士弗里堡大学博士毕业,成为电子科技大学特聘教授,博士生导师,29岁获中国青年科技奖。发表论文300余篇,近200篇被国际SCI期刊收录,总引用超过10000次。一路走来,80后的周涛似乎被无数光环笼罩着,不过,他的合作伙伴和学生更习惯称呼他一声——“涛哥”。
最近这几天,一年一度的全国糖酒商品交易会正在成都召开,来参会的有一家是国内驰名的白酒企业,曾经和周涛的团队接触过,希望通过大数据技术,对产品研发、制造、营销等各个环节进行优化。但最近一段时间,对方却有些犹豫,趁着糖酒会客户在成都,他打算亲自再去谈一谈。
某酿酒企业负责人:像我们这种百年的传统企业,本来大数据这个事物它是个新兴事物,大家对这个东西认知度不高,不管是生产也好还有就是销售也好,销售数据就含有很多客户资料,还有生产数据是我们核心竞争力。这些数据收集起来以后如何保证这些数据的安全?
周涛:你们的客户资源,你们生产中的关键参数,你们窖池里面的生化指标,这类数据我们不能拿出来。我们比如说举个例子:你假设你现在有5000万的客户,那我可能拿五万或者一万,我来跑通,我的整个算法和程序然后完了之后呢,我把这个在你本地部署保证你的数据,不走出你的服务器,这样来保证你的数据安全。
客户资料和酿造工艺方面的数据,都是企业最核心最机密的东西,即使周涛说他们提供的大数据分析工具,能够在技术上实现数据安全,但还是没法彻底打消客户的顾虑,因为目前对于大数据归属、交易、以及安全,都还没有明确的法律法规,他们担心一旦操作不慎,会给企业带来不必要的损失。对此周涛也很理解。
周涛:企业它关注的点很简单,就是我的数据不要流失出去被我的竞争对手知道。它怕它的生产参数泄露出去。比如说:茅台要知道了,郎酒要知道了,泸州老窖要知道了,就很不愉快。
这次简短的碰面虽然没有解决问题,但周涛却发现了症结所在。其实他在和许多类似的传统企业接触中也发现,它们的确想利用大数据来进行企业各环节的优化升级,但苦于没有专业技术,而要请专业的公司来做,又需要对外提供足够多的数据。一想到这些数据在开发利用过程中被泄露的风险,大企业通常都会选择放弃。周涛不禁感慨,在技术上可以实现的事,因为没有法律、法规和制度层面的保障,究竟该怎么做,成了一个未知数。
2012年,周涛和电子科技大学的几位教授,怀揣着理想迈出校门,成立了数之联科技集团进行创业,致力于为政府、企业和机构提供集数据采集、存储、管理、分析、挖掘和应用为一体的大数据价值发现全产业链服务。
周涛和团队的小伙伴们通过爬取并融合公开的工商、质检、质押、知识产权、诉讼、招聘等企业信息,为3000多万家企业提供全息画像,通过深度数据分析,帮助政府打击非法集资; 他们研发的“医疗保险大数据监管系统”,将大数据应用于医疗保险控费领域,有效得遏制了医保基金不合理增长。目前累计覆盖8000万城镇医保和新农合人员;他们将超过3000万份国内简历数据、500万家企业相关数据,50万份精英国际人才数据进行整合分析,将职位需求与求职者进行自动化精准匹配,可以大大提升了企业和政府的人力资源管理效率。
这些大数据应用项目在一些政府和企业的成功落地和实施,极大地激发了周涛和小伙伴们的干劲,但更多的时候,他们却徘徊在大数据应用的门外,因为很多目标客户的数据源根本不愿意对他们开放。
上午和客户的洽商并不顺利,下午要约见的客户究竟能谈到什么程度,周涛心里也没有底。
匆匆吃完午饭,周涛赶到了电子科技大学,为了让洽商氛围更好一些,也能让客户看到大数据技术人员的研发状态,周涛把客户约到了电子科技大学的大数据研究中心。这次的客户是一家来自武汉的企业,因为拥有国资背景,手头采集了许多当地政府的政务数据,但这些数据采集完后,却并没有进行分析和挖掘。参观完实验室,客户开门见山得提出了自己的困惑。
楚天云有限公司总经理张书东:看到您在大数据研究中心,在很多技术的研究方向上可能有了一些成果,但是我们说中国的大数据,80%数据是在政府,所以我们在数据的集聚,包括数据的共享,这些问题还没有解决的情况下,和一些安全的,这些法规不健全的情况下,怎么能够把这个数据开放到您所研究的这个平台里面,这个是一个很重要问题。
成都数之联科技集团首席执行官周涛:这也是我们遇到的大的挑战,我总体的感觉就是很多地方的政府雷声很大,都说我要响应国务院的号召,我要把数据共享开放出来,但是在实际行动中,不管在体制机制,还是说它在操作的具体层面,因为要有一个具体实施方案,都没有办法,没有一个好的机制来开放。
张书东:这个肯定还是政府在顶层上,它还是要规划统筹这个事情,就是首先要解决这个政策和法规,这方面的问题,比如说要分级、脱敏,这些有保障,保证这个政府数据安全。
这家来自武汉的企业主要的工作是管理当地的政务云,当地政府绝大部分的政务信息都已经汇聚到了政务云。听着这位负责人介绍,周涛感觉好像挖到了一个富矿,自己和小伙伴们在实验室钻研的算法和打造的大数据分析工具,仿佛有了用武之地,但很可惜,在谈到进一步合作的问题时,因为是为政府提供服务管理大数据,这个客户的顾虑甚至还超过了上午会见的酿酒企业。
周涛:在怎么解决安全隐私,这个问题上,我觉得我们和他们一样,应该也是面临的困惑要比方法多。因为政府这些数据到底属于个人、属于政府还是属于机构,政府自己也不明白。泄漏出去可能产生多大结果,它也不清楚,要负多大责任它也不清楚,所以我们是责权利法。都不明白,所以政府是要困惑得多。我们处理这些方面要难受一些。
上无政策下无对策 数据安全标准空白 谁来做第一个吃螃蟹的人?
2015年8月,国务院印发了《促进大数据发展行动纲要》,全面阐述了我国发展大数据产业的意义、目标、任务和政策,此纲要的出台标志着大数据产业已被提升为国家战略高度,逐渐完善的政策体系为大数据产业发展提供了良好条件。就在几天前,人力资源和社会保障部引发了《关于支持和鼓励事业单位专业技术人员创新创业的指导意见》,这对周涛这个从高校走出的创业团队,无疑是一个好消息。国家层面的机制越来越完善了,但在基层落实怎样呢?在体制机制还不那么不健全的情况下,周涛在做些什么?能在多大程度上改变现状谋得大数据的产业化发展呢?
成都数之联科技集团首席执行官周涛:我是土生土长的玉林人,不知道有没有玉林街道的同事。今天一起来,那我想大数据这个概念,它实际上是在座的每一位都听过很多次的概念。
演讲台上,周涛正在给成都的武侯区政府做一场“大数据创新实践”的培训。周涛用了大量的案例来给大家普及,什么是大数据,大数据的发展趋势、大数据的应用以及它的价值,将近两个小时的讲座,为了使台下听众听着不走神,他还需要不时插科打诨,讲个段子、开个玩笑。
周涛:我非常欣赏《机械师》里面的那句话,它叫做胜利总是青睐有准备的头脑。我希望今天的报告时间不长,但是能让各位更好地为未来的数据时代做好准备,从而成为下一个时代的胜利者,谢谢大家。
类似这样给政府部门和企业的讲座,现在周涛几乎每个星期都会有一场,累计下来他已经做了上百场。
周涛 :首先来讲,培训对主讲人来说是一件非常痛苦的事情。因为你讲的东西,虽然每次会有一点不一样,但是百分之七八十应该都是一样的,所以不停做培训完全是没有学习,没有收获的事情。但为什么要做这个事?是因为很多事情是有一个时间窗口的。比如说智慧城市、数据科学、人工智能可能在这几年是关键的几年,所以在这个时候我觉得给一些大企业和政府讲述我们在前沿大数据发展中遇到的困难、挑战以及解决方案是有价值的。
周涛告诉我们,中国的运营商每天要记录50亿通电话,一家大型连锁超市每天的消费记录达到6000万条,一个搜索引擎每天要处理超过10亿次的访问请求,一个大型社交网站一个月仅照片就会更新10亿张。这些听起来多得吓人的数据似乎是一个十分诱人的市场,但这并不是大数据的全部。医疗、交通、气象、环保、金融、卫生等等很多领域的大数据,其实都还是“沉睡”的“孤岛”。
周涛 :那我曾经拿到过成都一年所有出租车的GPS(全球定位系统)数据,从我们的角度来想这个数据到底有没有价值,我觉得是很有价值。因为我们通过这个数据能够知道哪些出租车是在宰客,非常明显。实际上,从我们的角度来讲,我们认为这些数据的公开都会帮出租车公司提高生态、改良生态,可以提高我们的交通通行率,可以降低我们的出行时间。但出租车公司有一些其它的担忧。我总体觉得这是一个体制机制的问题,只要没有明确上级主管部门说可以公开这个数据,那他们的默认是我不做操作。
成都数之联科技集团董事长傅彦:在面对政府推产品的时候,其实还是有一些障碍。
傅彦,是周涛的创业伙伴,她告诉我们,2012年,党中央、国务院发布了《关于深化科技体制改革加快国家创新体系建设的意见》,认为“研发和成果转移转化效率不高”等问题已经成为制约科技创新的重要因素。2013年,党的十八届三中全会在深化科技体制改革的论述中更是提出,要“建立产学研协同创新机制”,要“创新商业模式,促进科技成果资本化、产业化”。正是这些政策的接连出台给了她很大的鼓舞,虽然已经到了知天命的年龄,她还是毅然辞掉了大学里学院副院长的行政职务,投身到了创新、创业的大潮中,但数据源的不开放,却让他们吃了一个闭门羹。
傅彦:因为目前作为政府来讲,一方面,希望我们给它做相应的一些产品的一个推入;但是另一方面,政府实际上它面临了一个数据的一个开放问题。那么这个开放问题的话,一方面它会涉及到很多的隐私,这个隐私如何去保护,一个是政府本身部门的隐私,还有个人的隐私问题,那么这些都是现在政府没有想清楚的。
国务院印发的《促进大数据发展行动纲要》明确指出,国家政府数据统一开放平台将在2018年底前建成,率先在气象、环境、信用、交通、医疗、卫生等20余项重要领域,实现公共数据资源合理适度向社会开放。但在大数据产业的从业者看来,这个纲要的推进却并不理想。最近几年,为了推动大数据产业的发展,行业内部自发成立了大数据产业联盟和大数据发展研究会。在成都,几乎每周都有跟大数据有关的论坛和分享会。这天周涛又一次主持了这次业内的沙龙。
周涛:如果没有数据安全标准的制定,其实我们是很难实现数据产业发展。去年,卫计委的大数据系统,但是这里面其实有很大的问题。就是我们患者的数据到底归属于谁。基于这个数据所产生的科研成果又应该属于谁。如果没有界定清楚这个产业的产权边界,因为谁都不敢开放这个数据。我们去跟政府一谈,政府就说这个上面没有政策,下面不敢做对策,我不敢开放。没有边界,没有产权,我们这个产业很难走得很强壮,我觉得这个事情是需要从国家战略高度层面去推动。它确定了,我们再来谈技术手段。
这次的沙龙,汇聚了政府主管部门、企业、科研机构、高校等各领域的大数据产业从业者,作为成都大数据产业联盟的理事长,周涛每次都会做详细的记录,在他看来这样的沙龙大家可以充分碰撞,无形之中总会对行业的发展起到推动作用。结束了长达两个小时的沙龙,周涛又一次背上书包,等待他的或许是一场学术交流,或许还会是与客户的谈判,当我们问周涛,现在觉得自己究竟是科学家还是企业家时,他给了我们一个很巧妙的回答。
傅彦:我觉得如果要给自己一个定位,我觉得我算一个学生吧。做企业实际上是我很希望去了解什么是企业家精神,如果我不投身到企业里面,我就不可能了解企业家他到底要经历什么磨难,有什么力量支撑他去不停地创新、去改良、去拼搏,又有什么力量支撑他去面对失败、挫折和打击。那做科学,我们学到的是用数据定量化的方法,用逻辑和理性来判断问题,不受一些其它东西的蛊惑。你想有多牛的科学家,那比我们厉害的太多了,有多厉害的企业家,比我们厉害得多。所以说我觉得这些都好像在爬一座高山,但是我们现在只是在山脚的一个亭子里面,其实值得仰望、值得去崇仰的东西太多。
半小时观察:
周涛说,自己一直都在爬山,希望能够爬上大数据的巅峰,而他看来,当前主要的障碍是如何解决大数据共享的问题。眼下无论是一些企业、政府部门对大数据共享带来的安全、隐私、法律等问题存在不少疑虑。其实任何一种创新往往意味着另一种旧有生产生活方式的消亡,关键在于我们如何一方面拥抱创新,另一方面通过制定规则最大范围地平衡其中的利害关系。在《促进大数据发展行动纲要》正文中“共享”共出现了59次,“开放”共出现了36处,充分显示了数据共享开放对国家大数据发展的重要性。我们希望相关部门能够与时俱进,与创新者同行,为大数据的发展助力。