孟小峰委员走进景德镇大学

2016年5月6日下午,“CCF走进高校”活动来到景德镇大学。CCF会士、杰出演讲者、CCF大数据专家委员会委员、中国人民大学孟小峰教授在景德镇大学湘湖校区国际报告厅作了题为《大数据管理:问题与思考》的专题讲座,信息工程学院、工商学院等师生代表共200余人聆听了本次讲座,讲座由信息工程学院院长肖绚主持。

讲座上,孟小峰谈到,最早的数据记录始于6000年前,当时记录着皇家税收、土地、谷物、牲畜、奴隶和黄金等情况。现今互联网和移动互联网技术的发展使得社会结构日趋复杂、生产力水平得到极大提升,人们的创造性活动得到充分展示。他指出,传统的信息系统是先有模式后有数据,而大数据时代的信息系统是先有数据后有模式。他认为,在大数据下,数据记录的“粒度”更加细致、“广度”更宽泛、“密度”连续不断。

孟小峰表示,在大数据时代下的大数据管理中,数据库是由模式到数据,而数据湖是由数据到知识,并提出大数据的关键技术是其融合、计算、存储、分析及隐私保护。孟小峰教授结合案例,通过对科学、公共安全及web大数据融合进行分析,指出应由“大数据”关联和融合凝聚成“大知识”,从而促使开发“大应用”形成大数据的“三要素”,最终实现数据和知识的融合。

enter image description here

孟小峰作题为“大数据管理:问题与思考”的讲座

enter image description here

活动现场

enter image description here

现场部分师生与讲者合影留念

听众感言:

朱奕琦(信息工程学院)

5月6日下午,在国际报告厅我们有幸能听到中国人民大学孟小峰主讲的关于大数据管理的讲座。

在讲座中,孟教授分别从六个方面展开:大数据的提出,大数据管理方法,大数据管理关键技术,大数据生态系统,结论与展望。

接着介绍了数据来源的演化:运营式系统(被动产生),互联网系统(主动产生),感知式系统(自动产生),并对这三种演变进行了讲解,通俗易懂的让我们了解了大数据。

教授还给我们分享了自己对大数据的理解:数据记录的“粒度”更加细致,数据记录的“广度”更为宽泛,数据记录的“密度”连续不断。

我们已经进入了一个前所未有的信息化时代,人们拥有了如此多的数据,才提供给我们利用大数据的分析处理手段,创造新的价值。也许有人以为我们大数据时代的还未来临。其实大数据技术早已渗透到我们中间,它被应用在垃圾邮件的过滤,新浪微博技术平台,谷歌翻译以及输入文字的自动纠错等。在大数据时代的环境下,数据量急剧发展,对数据的分析和应用不仅影响着我们的生活,更是改变了我们的思维方式。在大数据时代也有需要面对的挑战,比如采集、存储、分析、呈现的技术;隐私泄露;预测与处罚;黑客攻击和数据独裁等,这都是亟待解决的问题。

大数据已经成为许多公司竞争力的来源,未来可能整个行业的结构会发生改变,大公司和小公司最有可能成为赢家。如今的核心竞争力在于快速而廉价地进行大量的数据存储和处理。许多小型的公司对于大数据的处理毫无对策,所以大数据的管理是一个漫长的研究过程。大数据也将会影响国家竞争力。当制造业已经大幅转向发展中国家,而大家都争相发展创新行业的时候,工业化国家因为掌握了数据以及大数据技术,所以仍然在全球竞争中占据优势,在高速迈进大数据时代的同时,人类信息管理准则需要重新定位,这将带动社会核心价值观的转变。大数据时代,对原有规范的修修补补已经不足以抑制大数据带来的风险。保护个人隐私就需要对个人数据处理器对其政策和行为承担更多责任。同时必须重新定义公正的概念,以确保人类行为的自由。

大数据时代是信息化社会发展必然趋势,我们只有紧紧跟随时代发展的潮流,在技术上、制度上、价值观念上做出迅速调整并牢牢跟进,才能在接下来新一轮的国际竞争中摆脱受制于人的弱势境地,才能把握发展的方向,冲破与西方国家的差距。

通过孟教授的讲座,我们深入的了解了大数据,并对大数据的管理有了进一步的了解,但大数据的研究仍然是一个漫长的过程。

钟发家(信息工程学院)

在开始的时候,孟教授引用生活周刊的文章中的一句话,凡是有数字的地方,都应该有故事。揭示了现在大数据的背景,即数据就是信息,信息就是故事。

在已故Jim Gray在其《事务处理》一书中提到:早在6000年前,苏美尔人就是使用了数据记录的方法,已知最早写在石块上,19世纪后期,数据记录则是在卡片上进行,由此可见,用数据记录社会由来已久,并不是最近几年才产生的。

数据来源是由运营式系统到互联网系统再到感知系统,其数据源是不断发生改变的,由最开始的被动产生,到主动产生,再到自动产生,这是大数据发展的必经之路。与此同时产生变化的是人们对大数据的理解,数据记录的“粒度”更加细致,比如说,可以从企业信息细致到个人信息。数据记录的“广度”更加宽泛,数据的关联、交叉、融合更为迫切。数据记录的“密度”连续不断,是由简单分析到复杂分析的转变。大数据的管理方法也由传统的信息系统:先有模式后有数据,变为现代的信息系统:由数据到知识。由此可见,大数据是在不断更新发展进步的。

虽然在进步,但是与此同时也有问题产生,即大数据管理关键技术如何转变?如何处理数据的融合、计算、存储、分析和隐私?如何不被大数据误导?这些问题有待我们去思考,当务之急则是用户的隐私问题,在大数据时代极有可能重新识别出匿名的个人敏感信息,只能说目标定在寻求隐私挑战,以及给公开数据的政府、企业和个人一个定心丸,保证国家安全底线。

最后,孟教授给出他的结论,大数据虽然一直在进步,但是具有局限性,比如从整个时间轴来看大数据还是发展的不是很快,再比如在基因序列监测这一块,虽然人类已经有所了解,但是只占其中百分之四到五,这意味着有百分之九十五的潜力等待我们发掘。而且新的产业尚未出现,因为每次计算机的更新发展都伴随着新产业的出现,比如谷歌、雅虎等都是伴随着互联网的快速发展而出现的新产业。孟教授还让我们向前看,不要局限在现在,而要着眼于未来。

马心悦(信息工程学院)

在听完孟小峰教授的讲座之后,让我对大数据这个词有了更深刻的理解,它不仅仅在某一些的领域能起作用,而且渗透在各个角落,无处不在。

我在想,大数据概念对于教育来说会产生什么样的实用价值呢?一直以来,中国教育在研究教育的数字化,比如数字化校园,这个思路就是把我们教育的内容进行数字化,其结果指向的就是电子教材的研发或者是教学过程的数字化。美其名曰,这是教育技术的重要内涵。在教学过程中,学生的行为表现都可以被数据化,而这项研究不是任何一个专业可以深入下去的,它的专业性太强,所以我才会想到,所谓教育技术与其研究教育的数字化,不如研究教育的数据化来得实在,来的有意义。

孟小峰教授的讲座里面讲到,数据记录的“密度”连续不断,是由简单分析到复杂分析的转变。大数据的管理方法也由传统的信息系统:先有模式后有数据,变为现代的信息系统:由数据到知识。由此可见,大数据是在不断更新发展进步的。

大数据的出现,必然对诸多领域产生极大的冲击,某些行业在未来十年必将会得到突飞猛进的发展,而其他一些行业则可能会消失。典型的三十年河东三十年河西的道理,就像三十年前的数理化王子们,现在可能蜷缩在某工厂的小角落里颤颤巍巍的修理机器,什么东西在大数据的面前,就像信息完全透明一样,能够透过一切。

诚然,大数据的前提是海量的数据,只有拥有巨量的数据资源,方能从中查找出数据的关联性,才可以让通过专业化的处理,让其为企业产生价值。大数据已经成为许多公司竞争力的来源,未来可能整个行业的结构会发生改变,大公司和小公司最有可能成为赢家。

通过这次的讲座,也激起了自己想要去了解大数据的兴趣,想要去了解了解一下大数据是如何在这个大千世界运转的,在这个多元化的世界,保持在它的掌控之下。