【预告】CCF-MM走进高校@走进吉林大学

【预告】CCF-MM走进高校@走进吉林大学

CCF多媒体专委会 20240919日 09:22 北京

CCF-MM走进高校系列活动

CCF@U:

CCF-MM走进吉林大学

时间:2024921

地点:吉林大学前卫校区王湘皓楼B108报告厅

时间

活动安排

08:10-08:20

吉林大学领导致欢迎辞

08:20-08:30

CCF-MM走进高校活动介绍

08:30-10:00

特邀讲者:

郑文皇 教授,台湾大学

报告题目:

做个好研究,写篇好论文

10:00-10:20

中场休息

10:20-11:50

特邀讲者:

李泽超 教授,南京理工大学

报告题目:

面向多模态预训练大模型的知识增强

14:00-15:30

特邀讲者:

傅建龙 研究员,微软亚洲研究院

报告题目:

Generative    AI: Evolving from Vision-Language Understanding to Action    Generation

讲者/报告信息

郑文皇 教授

报告题目:做个好研究,写篇好论文

报告摘要:这场报告将基于个人经验,探讨如何在学术生涯中实现优秀的研究成果并撰写高质量的论文。内容从四个主要方向展开:首先,生活为上,健康的身心是研究的基石,保持工作与生活的平衡是长期学术发展的关键。接下来是科研为本,研究是学术工作的核心,找到合适的研究题目、深入探索并保持专注是成功的关键。第三是发表为体,学术成果需透过分享与发表才能发挥影响力,提升写作技巧与投稿策略等学术能力,有助于提高论文的可发表性。最后,学习为常,持续学习是保持研究敏感度的要素,例如透过培养创意思维,不断精进自身的研究能力。综合这四个面向,希望帮助大家找到适合自己的研究方向与发展路径,为学术界做出卓越贡献。

讲者简介:郑文皇,博士,现任台湾大学拔萃讲席教授,KAIST(韩国科学技术院)客座教授,曾任职于台湾交通大学电子研究所特聘教授兼智能系统研究所创所所长,长期致力于人工智能与多媒体前瞻技术的研发,特别专注于多媒体内容分析、计算机视觉和机器学习等领域的研究。他在国际顶尖期刊与会议上发表了超过百篇学术论文,包括知名期刊如IEEE Transactions on MultimediaIEEE Transactions on Image ProcessingIEEE Transactions on Neural Networks and Learning SystemsIEEE Transactions on Knowledge and Data Engineering,以及计算机视觉与多媒体领域的重要国际会议如IEEE CVPRIEEE ICCVECCVACM Multimedia等。郑教授的学术贡献与影响力获得了众多重要学术奖项的肯定,包括2018年“微软亚洲研究院合作研究奖(MSRA Collaborative Research Award)”、2020年“国际计算机学会杰出会员(ACM Distinguished Member)”(全球仅64位获奖者)、2021-2022年“国际电机电子工程师学会杰出演讲者(IEEE Distinguished Lecturer)”、2023年“全球前2%顶尖科学家(World's Top 2% Scientists by Stanford University)”等。由于他在“智能多媒体计算与应用(for contributions to intelligent multimedia computing and applications)”领域的学术贡献,荣获学术科技界公认为权威荣誉和重要职业成就的“IEEE Fellow”称号,并担任IEEE Transactions on Pattern Analysis and Machine IntelligenceIEEE Transactions on Multimedia等顶尖国际期刊副主编(Associate Editor)



李泽超 教授

报告题目:面向多模态预训练大模型的知识增强

报告摘要:近年来,在探索通用人工智能的可能发展方向中,多模态大模型已成为当前备受关注的重要方向,收到了学术界和工业界的广泛关注。多模态大模型的研究任务涵盖多模态问答和推理、图文生成、图像理解与推理等各个多个方面的内容。本报告着重介绍了研究团队在面向多模态大模型的知识增强方面的研究工作,围绕外部知识和模型知识两个方面开展了多模态预训练大模型与下游任务的适配问题研究,重点介绍基于多模态预训练大模型的小样本识别、图像理解、视觉问答、语义分割、图像检索、视觉定位等下游任务的适配工作,最后介绍在实际业务上的应用情况。

讲者简介:李泽超,南京理工大学计算机科学与工程学院/人工智能学院/软件学院教授、副院长,国家杰青,“社会安全信息感知与系统”工信部重点实验室副主任,分别于2008年和2013年毕业于中国科学技术大学和中国科学院自动化研究所。研究兴趣主要是媒体智能分析、计算机视觉等。发表CCF A类期刊和会议论文60余篇;入选国家“万人计划”青年拔尖人才,获得江苏省科学技术一等奖2项、中国电子学会自然科学一等奖1项等;获得ACM MM Asia 2020最佳论文奖等;主持科新一代人工智能国家科技重大专项课题、国家自然科学基金联合基金重点项目、江苏省杰出青年基金等;担任IEEETPAMI, TNNLS等期刊编委。



傅建龙 研究员

报告题目:Generative AI: Evolving from Vision-Language Understanding to Action Generation

报告摘要:Generative artificial intelligence (AI) is revolutionizing various fields, especially in consumer content creation, with significant advancements driven by large foundation models like GPT-4 and Sora. This talk delves into the rapidly evolving landscape of generative AI and its transformative potential in empowering consumers to effortlessly create personalized and compelling content. We will start by showcasing our work in generative AI, focusing on its applications in generating images and videos. Following this, we will explore the emerging trend of progressing from visual generation to action generation in visual agents and real robots (i.e., Embodied AI). By examining the latest developments in these areas, we aim to highlight innovative solutions that bridge the digital and physical worlds, enabling AI systems to perceive, understand, and interact with complex real-world environments. The talk will conclude with an open discussion on best practices for conducting impactful research, fostering collaboration, and pushing the boundaries of what AI can achieve.

讲者简介:Dr. Jianlong Fu is a Principal Research Manager leading the research and innovation efforts in the Multimodal Computing group at Microsoft Research Asia (MSRA). He is recognized as an IEEE Distinguished Lecturer, ACM SIGMM Rising Star, and Intelligent Computing Innovator by MIT Technology Review in 2024. His research primarily focuses on multimedia content understanding and multimodal perceptual computing across images, videos, and embodied agents. Dr. Fu has authored over 100 peer-reviewed papers, accumulating more than 16,000 citations. He has received several prestigious awards, including the Best Paper Award at ACM Multimedia 2018 and IET ICETA 2023, and has won over 10 international competition championships in CVPR, ICCV, and ECCV. He serves on the editorial boards of ACM TOMM, IEEE TMM, and IEEE CEM, and was a guest editor for IEEE T-PAMI from 2019 to 2021. His research contributions have been integrated into various Microsoft products, including Windows, Office, Bing, Azure, Edge, and XiaoIce.

执行主席

谢洪霞 副研究员

简介:谢洪霞,吉林大学计算机科学与技术学院助理教授/副研究员,博士生导师。主要研究方向是人工智能、计算机视觉、情感计算等领域,当前研究兴趣为视觉-语言预训练大模型。主持国家自然科学基金青年项目,近五年共计发表学术论文近20篇,包括以第一/通讯作者在CVPR、 ICCVACM MultimediaIEEE Transaction on Affective ComputingIEEE Transaction on Cybernetics等中国计算机学会推荐国际A类会议/中科院一区期刊发表论文多篇;发表论文曾获得CCF-B类会议IEEE ICME最佳论文奖。

报名参会

本期CCF-MM走进高校活动的地点是吉林大学(前卫校区)(吉林省长春市朝阳区前进大街2699号)。本次会议不收取注册费,食宿差旅自理。

会议联系人

联系人:谢洪霞 

联系电话:13123057815

微信扫一扫
关注该公众号