数联铭品首席科学家周涛:大数据时代,不仅是技术和算法的变化

编辑时间: 2016-04-15 16:19:06    关键字:大数据时代,技术和算法

近日,“四川企业家创新论坛”上,迎来第二场论坛的主讲嘉宾——电子科技大学大数据研究中心主任、数联铭品联合创始人、首席科学家周涛。

在被热情的听众几乎挤爆的西南财经大学柳江校区演讲厅,这位央视年度十大科技创新人物,用了整整2个小时的酣畅演讲和交流向听众展示了大数据时代的魅力。

“要用你的一生去做伟大创新。”

以下为演讲实录:

今天我给大家讲四个方面的内容:

第一、什么力量把我们推动到今天这个所谓的大数据时代

第二、大数据怎么样去支撑整个中国未来经济社会发展的重大战略

第三、大数据的精髓和现实魅力

第四、对下一代,我们期望你们做什么样的一代人

大数据时代,不仅是技术和算法的变化

现在大数据这个概念很热,我希望通过这场论坛让大家能够去甄别:哪些是真正大数据创新、哪些是伪大数据。

驱动大数据产业发展走到今天,有三个趋势。第一个趋势是数据爆炸性增长。现在每天在亚马逊有几百万数据,淘宝有10多亿数据,互联网有4万多亿网页。这意味着,普通人甄别信息能力和可获得信息量爆炸性增长,这之间的矛盾我们把它叫信息过载。

很多商业模式都来自于此。比如说互联网上怎么样找喜欢的歌、喜爱的商品,甚至大家到百合网、珍爱网找个好对象,这就涉及对无穷多的信息处理。大数据中典型的商业模式,就是精准广告搜索推荐等。

第二个趋势就是数据形态正发生变化。比如,以前我们用excel表格管理一名学生,知道是男是女、在哪毕业、家庭住址等。有了这些数据,我们就可以通过建立回归、关联等方法,得到变量和变量的关系。举个例子,成都某中学哪些学生毕业后发展更好,女孩子是否更适合会计专业等,这些都不是大数据,这是几十年前的时候早期数据。

而现在我们面临的绝大部分数据都是非结构化数据,比如文本、视频、语音、图像,还包括社会关系网络,它们也有着巨大价值。举个例子,假如我们靠某个人手机行程的轨迹数据,只要有3年或以上的追踪,比如他经常去五星级酒店、高尔夫球场和高档会所,就可以很好地判断其经济收入水平。再往外延伸,比如我3年前曾经在北京帮一个关于医疗的手机APP做过一个商业项目。他们提出需要,要找在北京医院工作的医生。这些医院的经纬度我们是清楚的,但如何判断进出这些医院的人哪些是医生呢?通过比对这些医院进出人员的频次,我们发现如果某人进入医院很快就出来,那么他可能是病人;如果进入医院再也不出来,可能就去世了。我们从中找出那些每天有规律进出的人,很大可能他们就是医生或医疗工作者。

第三个大的趋势,是大数据真正不一样的地方,就是数据的关联发生了变化。以前的数据是单独的,比如一个人,淘宝知道他买了什么东西,新浪微博知道他有什么朋友,医院知道他患了什么病,但这些对同一个人的数据是没有打通的。我们现在通过商业模式、技术资本,可以把这些数据打通。比如阿里巴巴投资新浪微博,两年前推出新淘浪;还有企业通过一个软件管理所有社交账户、豆瓣账号、支付账户等,这里面带来一个很好玩的事情,就好像围绕一个人360度拍照,知道这个人的全息影像,就可能带来很大商业价值。比如这个人的征信。但这也可能影响到他的隐私。所以大数据的第三个挑战是,如何在安全隐私可控的情况下,充分利用这些关联数据来形成1+1>2的价值。

大数据时代不是说某种技术或者某种算法的变化,而是某种理念的变化。大数据是针对关联异构化数据深度分析。从关联性看,是生活方式、商业模式、管理流程等一切颠覆性变化的总和。未来新型的企业,乃至政府,对于他们而言数据的采集分析都是核心战略。

如何运用大数据,对企业进行征信评级

第二个大方面,大数据是怎么样在某些方面支撑一个国家的经济社会战略发展?

首先就要求创业者要把握好社会发展整个趋势。在今天创新创业驱动发展过程中,企业遇到的痛点是什么?创新企业尤其是小微企业,大多是轻资产企业,这些企业创业想的是先做个APP,而不会去拿一块地。绝大多数创新企业没有资产可以质押,他就没法通过传统渠道进行融资。

通过双创驱动解决中小微企业融资难问题,也是诸如数联铭品这类大数据公司的主要内容之一。我们怎样用大数据来解决这个问题?因为我们的目标是对企业进行征信评级,对公司债进行定价。解决这个问题不是走传统的道路,我们是在互联网上采集大量公开数据,包括它所处的行业、注册资本、实缴资本、股东、董事等方面。有了这些信息,我们再结合企业发展得到几个要素:第一,你所处的行业市盈率好不好,盈利情况,有没有上市潜力;第二,你是否存在关联交易的风险,比如你的股权关系是否有风险;第三,看你的董事、监事、高管和投资方关系,看你背后投资方和股东是不是优质良好。

其次,我们还有大量公司资产数据、人力资源招聘数据、招标投标数据和法律诉讼数据等。例如,一个企业发展好坏,很大程度上可以通过人力资源招聘看出来。同时,还可以看企业在招投标中胜出几率、价格。另外,企业有没有法律诉讼,尤其是关于合同、股权诈骗的诉讼,是评价企业很好的指标。利用这些指标,我们就可以不依赖于企业主动提供的有可能虚假的财务报表,对企业的信用和风险进行全面和精准的评估,从而推动真正针对小微轻资产企业的征信评级和公司债定价,这就是非常典型大数据运用。

从这些方面看,我认为大数据的分析和运用,一定程度上可以支撑国家的经济社会战略发展。

如何在3万人中,找出最孤独的那一个

我觉得大数据的精髓,就是能够把数据外部化。比如,谷歌曾经把它大量的搜索数据与疾控中心传染病报告的人数做了一个关联分析,实际上就是一个简单的线性回归模型,它最终能够比较好地预测传染病的流行,并且能够提前一周预测出突然的上升和下降。这个例子就说明了,表面上看起来是我的搜索数据和你传染病模型是风马牛不相及的事,但却通过这些数据解决了你的大问题。

我们在电子科大还做过一个课题——寻找校园中最孤独的人。我们从3万名在校生中,采集到了2亿多条行为数据,它们来自学生选课记录、进出图书馆、寝室,以及食堂用餐、超市购物等数据。通过对不同的校园一卡通“一前一后刷卡”的记录进行分析,可以发现一个学生在学校有多少亲密朋友,比如恋人、闺蜜。最后,我们找到了800多个校园中最孤独的人。他们平均在校两年半时间,一个知心朋友都没有。这些人中的17%可能产生心理疾病,剩下的则可能用意志力暂时战胜了症状,但需要学校和家长重点予以关爱。

这些例子,其实都透露了大数据的三个精髓:第一个,是数据的外围性。例如一卡通的数据,其实来自学校的后勤集团,本质上是一种消费数据,但我们利用这种数据来预测学习成绩、观察学生作息是否有异常,通过看起来没有关系的数据去透视问题;第二个,是数据的群集性。光有一张卡,你分析得再清楚,也看不出什么问题,只有把这张卡放在3万张卡里才能看出端倪;第三个,是这些数据其实存在很多年了,一卡通和学校的心理健康中心都存在十几年,但一直没有发现两者之间的关系,为什么?因为缺乏数据科学家,需要有人针对这些数据去进行分析。

年轻人创业,首先要考虑格局与方法

讲完了大数据,我还想对大家说一句,不管你们是要创业或做什么事情,都要考虑两个问题:格局和方法。

第一,你要思考自己做的事是否具有原始的重要的创新性?例如谷歌开发阿尔法狗,以前很多人都认为这是不可能的,但这件事的美妙之处就是在于,把以往不可能的事情变成可能。你要用你的一生去做伟大创新。企业的核心价值是它对社会的贡献,而不是挣了多少钱,选择的方向很重要。

其次,你们的价值观不能高度统一。你们一定要想清楚自己喜欢什么,如果你想的和全社会都一样,那么你其实可以消失了,因为有你没你都没关系。

最后我还想说,你要有战斗的情怀。今天很多人可能觉得我讲的这些都是务虚的,但人在不断往前走的历程中,你会发现我讲的这些都是需要的。

我对自己的定位,是希望我的工作和人生能去影响下一代,你们也要去想如何成为一代人的榜样,如何抓住这个时代脉搏发展中所缺失的东西。

另外,在人的一生之中,千万不要怕重大挫折和痛苦。从这个问题出发,我还想给大家讲我比较欣赏的一句话,是儒学乃至中国文化传统中著名的“十六字心传”——“人心惟危,道心惟微;惟精惟一,允执厥中”。我主要想讲的是中间这个“惟精惟一”,它说的是什么呢?

人生之中会有很多诱惑,但你要把所有能量集中起来做唯一的事,其他的事都不重要,不要把事做碎、做杂,很多事情你都想要做一做,那你就很难登上巅峰,所以,不是你的核心事情,不要去做。

现场交流:

大数据进行征信评级,同样需要保护企业隐私

Q1:你更多精力放在学术还是公司管理上?技术人才如何担当公司创始人?

周涛:我一方面做纯理论研究,我的这块理论研究其实是很难产业化的。另一方面,我在企业里主要进行战略决策、市场资源整合,以及投融资事务。我认为,任何一个人靠一己之力都很难撑起所有,像我就很难管理超过10人的团队。那么他如果想要成功,就要具备两个能力:一是领导力。不断给团队打鸡血,朝着共同的梦想去战斗;第二个是被领导的能力。你要给团队成员充分权力去做决策,你就跟着这样的决策走就是了。总之,千万别想让自己变成一个多面人,或去学着做一些本身不擅长的事情。

Q2:作为一家大数据公司,数联铭品如何保护企业隐私?你们开展企业征信业务,被你们“评级”的企业是否具有知情权和异议权?

周涛:我们的数据有两个来源,第一个是公开数据,例如企业工商登记中必须公开的法人等信息、法院判决的公开文书等,我们采集这些数据做成报告,这块不涉及隐私;当然,还有一部分数据的确涉及隐私,例如企业财务的真实数据。当我们在为企业提供服务时,就需要征得企业的授权,去查看这家公司的真实财务数据;如果企业不授权,我们就不会用这些数据。征信业务这块,目前我们拿到了企业征信牌照,企业如果向我们申请征信时,我们会告知这些征信会向哪些机构公开。

Q3:你对传统银行业的产品创新有没有研究?

周涛:例如债券市场,在美国的规模比中国大得多,一旦放开,就存在很大的机会。还有保险,目前我们国内的保险规模也比美国小,并且呈现高度同质化,实际上通过大数据,我们可以建立出很多精算模型,更好地为传统银行业服务。例如,如果我们能拿到个体的一些医疗数据,就可以推算一个人在多少年后有患上糖尿病概率,对应的,他的医疗保险应该如何变化,这些都可以计算出来。

推荐热图

合作推荐

2010-2018 可思数据版权所有 About SYKV | ICP备案:京ICP备14056871号