期刊及会议

tcdb_qkjhy

2021年度VLDB暑期学校成功举办

由中国计算机学会(CCF)主办、数据库专业委员会和贵州大学联合承办、中国人民大学平凯星辰(北京)科技有限公司协办的2021年度(第20届)VLDB暑期学校(VLDB Summer School 2021)于2022年1月17日-2022年1月23日在海南海口鑫源温泉大酒店成功举办。本次活动得到了PingCAP公司的赞助。

图片1

 2021年度VLDB暑期学校的主题为分布式事务处理,授课采取理论+实践方式,这也是VLDB暑期学校自创办以来授课模式的一次重大变革。理论授课部分安排在上午,组委会邀请了在分布式事务处理方面有丰富科研和教学经验的青年才俊:威斯康辛大学的于向遥博士、前Amazon Redshift工程师吴英骏博士、上海交通大学的魏星达博士,他们分别就并发控制算法、日志与复制、云原生事务处理、确定性事务处理、分布式事务与分布式系统的一致性、新硬件加速分布式事务处理等前沿问题进行了深入浅出的讲解;下午的实践环节,组委会邀请了PingCAP公司的一线工程师组成实训教师团队,围绕分布式事务处理原型系统构建这一实训目标,设计了四个具体的实训任务,并在实训过程中给予了细心和耐心的指导。

图片2

图片3

图片4

图片5

 受疫情影响,本次活动采取线上线下混合的方式;经过遴选,本次活动共计114名学员参加(80名学员线下参加,34名学员线上参加),分别来自清华、北大、浙大、人大、复旦、哈工大、北航等26所高校以及中兴通讯、中新赛克、奇点无限、阿里巴巴等企业;此外,数据库专业委员会常委和特邀嘉宾共21人也受邀出席了暑期学校的不同活动。活动取得了很好的效果。通过对学员满意度调查,上午的授课满意度,平均超过92%。下午的实操环节,82%的小组完成了全部的4个实训项目,实现了分布式事务处理原型系统的构建。学员们普遍反馈,这样的活动应该多办。

图片6

图片7

图片8


以下是具体的活动详情:

【活动第一天:2022118

       2021年度VLDB暑期学校于2022年1月18日在海南鑫源温泉酒店国际会议厅隆重举行开班仪式。出席开班仪式的嘉宾有:中国计算机学会数据库专委会主任委员、西北工业大学李战怀教授(线上),中国计算机学会数据库专委会前任主任、VLDB暑期学校校长、中国人民大学校长助理杜小勇教授,中国计算机学会数据库专委会副主任、北京大学崔斌教授,中国计算机学会数据库专委会秘书长、中国人民大学陈跃国教授,中国计算机学会信息系统专业委员会主任、数据库专委会委员、东北大学于戈教授,中国计算机学会数据库专委会常务委员、中国人民大学信息学院党委书记陈红教授,中国计算机学会数据库专委会常务委员、华东师范大学钱伟宁教授,本次暑期学校承办单位贵州大学李晖教授,赞助单位PingCAP联合创始人兼CTO黄东旭先生(线上),主讲教师、威斯康星大学助理教授于向遥(线上),以及来自北京大学、清华大学、东北大学、华中科技大学、西北工业大学、中国人民大学等20余所高校的114名学员。开班仪式由中国人民大学卢卫教授主持。

图片9

      仪式开始,专委会主任委员、西北工业大学李战怀教授首先进行了致辞。他强调了VLDB 暑期学校是一个为我国培养数据库人才的公益性平台,祝愿每个满怀希望而来的老师和同学,都能满载收获而归。贵州大学李晖教授向大家分享了自己多次参加VLDB 暑期学校所取得的收获,愿意在自己有能力的时候做点事情回馈专委会,他希望参加此次学习的同学同样可以收获满满。PingCAP联合创始人兼CTO黄东旭先生从自己学习数据库的经历出发,认为实践对数据库学习至关重要,期待大家通过实训环节的培养,能在此次VLDB 暑期学校中得到实践能力上的提升。VLDB 暑期学校校长、中国人民大学校长助理杜小勇教授介绍了VLDB 暑期学校的发展历史及办学初衷,并从学习和防疫等各方面对同学们提出要求,希望同学们认真学习,相互交流,并提醒同学们在特殊时期时刻注意防疫要求,祝愿同学们能充分利用此次机会,努力提升自己,未来为推动中国数据库事业的发展贡献力量。开班仪式结束,在场的全体同学与与会嘉宾共同合影留念。

图片10

本届VLDB 暑期学校的第一课由威斯康星大学于向遥教授主讲。于教授以“introduction to distributed transaction processing”为题,以两个半天的时间,从事务处理的并发控制、日志存储与故障恢复、高可用等多方面,深入浅出地向大家构建出分布式事务执行过程的全貌。于教授着重介绍了分布式并发控制的代表性算法,讲解了日志存储与数据恢复的原则和方法,并且对分布式数据库的备份方法与相关工作进行了介绍与说明。通过他的讲解,同学们对分布式事务的主体逻辑有了更为系统性的认识,为接下来的课程学习与编程实操奠定了理论基础。

图片11

图片12

 1月18日下午,来自PingCAP的数据库工程师童牧、龙方淞等指导同学们展开了编程实训环节的第一次课程,本次课程的主要内容为熟悉实训平台开发环境及实现 Raft日志引擎。在讲解结束后,同学们以分组的形式开始进行编程实操,通过个人独立思考与小组讨论,同学们对Raft日志引擎有了更为深入的了解,并得到了编程能力上的锻炼。

图片13


活动第二天:2022119日】

 1月19日上午的教学环节继续由来自威斯康星大学的于向遥教授进行线上授课。于老师在第一日教学内容的基础上继续深入,以分布式事务处理为主题,详细介绍了云原生事务处理与确定性数据库两方面内容。于老师以数据库向云上迁移的趋势为出发点,分析了云数据库的特点与优势,进而延伸到云端分布式数据库的常用架构,并通过对两个经典的云数据库系统的分解介绍,向同学们详细讲述了现实场景下云数据库的主体逻辑与具体实现。对于更前沿的确定性数据库这一方向,于老师在细致讲解其研究价值之后,通过对一些极具代表性的相关工作的讲述,为同学们简洁明了地构建出确定性数据库的工作架构全貌,并且提出了自己的深入思考。于老师的授课不仅内容详实,并且深入浅出,引人入胜,在场教师与同学纷纷在提问环节积极展开了讨论与思考。

图片14

 1月19日下午,VLDB暑期学校前校长、华东师范大学副校长周傲英教授,PingCAP CTO黄东旭先生与线下的同学进行了交流。周傲英教授给同学们介绍了VLDB暑期学校创始人陆宏钧教授,并回顾了VLDB暑期学校发展历程。对于今年活动的主题:分布式事务处理,他表示,数据库的应用对于企业金融等重要方面核心能力的加强有重要作用,事务处理则是数据库中举足轻重的部分。只有做好事务处理,才能有竞争力。同学们在进行事务处理的研究之前,一定要掌握数据库最本质的共性特征,深入理解数据库的抽象架构。此外,周傲英教授还表示,中国的数据库发展应该走向世界,希望同学们和老师们站在巨人的肩膀上继续共同努力,不断进步,逐渐展现出中国数据库人的实力。

图片15

 黄东旭先生表示,在数据库领域不断发展,越来越多类型的数据库不断出现的情境下,如何将不同类型的数据库有机融合成为一个挑战。对此,他鼓励同学们:计算机作为实践科学,只要敢于迈出第一步,就总会发现解决办法。

图片16

下午的编程实践环节的主要内容之一是实现一个简单的2PC框架,为此暑期学校邀请了来自PingCAP产研OLTP团队的负责人张金鹏为同学们进行理论讲解。他从理论出发,从分布式事务模型percolator简介、基于percolator的优化方法、TinyKV中的percolator优化三个方面为同学们详细介绍了percolator的基本架构。通过对这一经典分布式事务模型中存储设计、基础接口和工作流程的学习与讨论,同学们对编程任务有了更多的信心。

图片17

讲解结束后,同学们在PingCAP数据工程师徐锐、童牧和助教的指导下,继续以小组形式进行编程。经过前一天的认识磨合与主讲教师、实训讲师的指导,大家对本次暑期学校编程任务的认识更加系统与深入,很快结束了单独学习状态,积极投入小组编程任务中。

图片18


活动第三天:2022120日】

1月20日上午的课程由Singularity Data的CEO吴英俊博士主讲,课程主题为“ACID and CAP in Modern Database Systems”。在开始授课之前,吴博士首先对自己的个人履历做出简单介绍,希望能从自己的科研及创业的经历提供给大家帮助。

图片19

在授课过程中,吴博士从ACID和CAP的概念出发,重点介绍了现代常用的MVCC并发控制算法,从并发策略、版本存储、过期版本回收等多个方面介绍了各类数据库产品所实际采取的策略,从企业与工业界的视角带领同学们对MVCC并发控制方法产生了全新的认识。此外,吴博士同样对索引管理、故障恢复、两阶段提交等分布式事务的具体问题进行梳理与分析,最后针对同学们在听讲过程中产生的疑问进行了解答。通过吴博士的讲解与答疑,同学们对分布式数据中系统中的ACID与CAP从概念及具体的解决策略上都有了进一步的了解。

图片20

最后,吴博士向大家介绍了一个学生项目RisingLight,希望同学们在系统学习数据库知识之余,可以参与其中,增强对OLAP系统的了解与实践。

1月20日下午的实训课程由PingCAP的数据库工程师童牧老师向大家讲解了MVCC并发控制算法和SI隔离级别,本次实操课程的目标为在2PC框架基础之上实现一个SI隔离级别事务机制。

图片21

图片22

      在讲解结束后,针对大家对代码架构不熟悉的问题,童老师对实操所使用的TinySQL架构进行了详细讲解,并针对实验进度较为缓慢的同学对之前的实验问题进行了集中答疑,帮助同学们进一步提升实验效率。通过20日下午的集中学习与小组讨论,同学们的实操能力得到进一步提升。


活动第四天:2022121日】

公开学术报告和论坛是VLDB 暑期学校的传统活动。1月21日上午,暑期学校举办了“分布式数据库与人才培养”论坛。卡内基梅隆大学计算机科学系长聘副教授Andy Palvo、阿里巴巴集团高级副总裁李飞飞和PingCAP联合创始人兼CTO黄东旭为论坛作了特邀报告,北京大学教授崔斌、中国人民大学教授陈红、浙江大学教授陈刚、华东师范大学教授钱卫宁以及李飞飞、黄东旭参加了圆桌论坛,活动由中国人民大学教授杜小勇主持。

图片23

Andy Palvo教授以“You are Overpaying Jeff Bezos for Your Databases and How Machine Learning Can Halp”为题做报告,他谈到由于手动调整数据库管理系统(DBMS)配置参数非常困难,所以这个问题的一种解决方案是使用机器学习(ML)来设计策略以自动调优。同时,他对OtterTune数据库调优服务进行了简单概述,并与同学们讨论了为DBMS部署基于ML的服务必须要克服的挑战。李飞飞教授以“分布式数据库事务管理和数据一致性”为题作报告,他系统性地回顾和总结了分布式事务的经典机制和分布式数据库确保数据一致性的挑战,并介绍了结合2PC、HLC和MVCC的新的分布式事务处理机制和PolarDB-X系统的高效分布式事务处理技术。黄东旭先生围绕“真实世界的分布式事务:现状和挑战”话题展开演讲,分享了TiDB研发中遇到的一些实际问题、挑战和经验。

图片24

图片25

在圆桌论坛环节,6位特邀嘉宾就“数据库内核人才培养”话题从学生、教师和企业三个方面展开讨论,各位老师先依次介绍了自己所在高校开设数据库课程的情况,并对于未来数据库课程重构、数据库开发研究和学习方向等问题发表了自己的观点,与会场的同学们进行了互动。

图片26

最后,杜小勇教授对本次论坛进行了总结,并表示对未来数据库内核的发展和人才的培养充满了期待。

图片27

本次暑期学校新设置了由赞助企业主导的活动,PingCAP 公司进行了精心的准备。21日下午,他们首先邀请了PingCAP的联合创始人兼CEO黄东旭先生、IoTDB的主要研发者之一黄向东老师和PingCAP的研发团队负责人唐刘老师就开源实践与学生成长进行对话。三位老师根据切身体会谈了自己如何走向开源之路、如何通过开源来助力人才培养、小白如何利用开源提升自身的实践能力、企业为何青睐于开源等广泛的话题,并与同学们进行了积极的互动、给同学们提出了很多启发性建议。

图片28

       之后PingCAP TiDB负责人姚维,向同学们介绍了TiDB设计的传统栏目——Hackathon,同时阐述了如何加入一个开源项目以及如何获得中意公司的关注、自己的开源项目怎样获得投资人的投资以及如何成功走向创业之路。 PingCAP王岩广先生介绍了他们开发的开源实践课程Talent Plan,并介绍公司将该课程升级成全方位的开源教育实践Talent Plan学习社区的计划

 活动之后举行了“PingCAP之夜,师生们在品美味的同时,也增进了相互的了解和友谊。

图片29图片30


活动第五天:2022122

 1月22日上午,暑期学校第五天课程是由上海交通大学助理教授魏星达授课,魏老师围绕“FAST In-memory Transaction Processing using New Hardware Features”为话题向同学首先介绍了数据中心广泛部署应用的硬件以及其特性和使用限制,分析了HTM、Intel RTM和RDMA的具体处理方法、近期发展和存在挑战,阐述了基于HTM和RDMA的分布式事务系统DrTM的局限性和相应解决办法,同时介绍了将OCC引入的事务处理机制DrTM+R,最后与同学们交流了分布式系统性能提升经验。

图片31

图片32

1月22日下午,来自PingCAP公司的张建先生首先向大家介绍了分布式时钟的相关内容,接着阐述了TSO在Geo Application场景下的一些优化,随后解释了TSO如何与Stale Read结合起来提供Stale Read的功能,最后阐述了TinySQL或TinyKV中所涉及的事务模型。接下来的时间同学们就通过小组的形式进行了实操,从实际编程中去理解并加深知识点。

图片33


活动第六天:2022123日

本届VLDB暑期学校历时6天,闭幕式于2022年1月23日上午在海口市鑫源酒店国际会议室举行。闭幕式前是学生的分组汇报,卢卫教授主持了这个环节。共有18个小组报名进行汇报,其中线下16个小组、线上2个小组。每个小组从原型系统演示、小组分组与协作情况、本次活动的收获与感受等方面进行汇报。邀请了钱卫宁教授(组长)、张峰副教授、魏星达博士、童牧、龙方淞五位老师组成专家评审团,对各组进行评分和点评,最终评出了三个小组12个优秀学员。

图片34

图片35

图片36

图片37

 数据库专委会秘书长陈跃国教授主持了颁奖和总结环节。杜小勇教授、陈红教授、陈跃国教授、袁野教授等分别为主讲讲师、实训讲师、实训助教、技术支持、组委会共同主席、志愿者、承办单位、协办单位、优秀学员、积极参与学员发放了奖状和奖品。

图片38

图片39

图片40

图片41

图片42

图片43

图片44

图片45

图片46

 最后,数据库专委会主任李战怀教授、PingCAP产品研发负责人唐刘、VLDB暑期学校校长杜小勇教授做了总结发言。第20届VLDB暑期学校落下帷幕,取得了圆满成功。

图片47


附录:2021 VLDB暑期学校组织机构

杜小勇 教授(中国人民大学)

本期组委会

学术委员会主席

杜小勇 教授(中国人民大学) 李战怀 教授(西北工业大学)

组织委员会主席

李晖 教授(贵州大学) 卢卫 教授(中国人民大学) 王岩广(PingCAP)

主办单位

中国计算机学会

承办单位

贵州大学计算机科学与技术学院

中国计算机学会数据库专委会

协办单位

中国人民大学

平凯星辰(北京)科技有限公司