自发布以来,大模型的技术变革日新月异。接下来,大模型领域又会发生哪些故事?哪些技术方向又将占据下一个十年的主流?作为时代的见证者与参与者,开发者们该如何把握随之而来的机遇和挑战?
为助力AI技术从业者把握时代趋势、重塑开发思维、探索AI能力边界,由世界人工智能大会组委会办公室指导,机器之心主办,上海张江(集团)有限公司作为战略合作伙伴的2023世界人工智能大会AI开发者论坛于7月8日在上海张江科学会堂举行。论坛以“大模型时代的AI开发”为主题,汇聚了海内外备受关注和认可的顶尖技术大咖,以及来自微软、百度、科大讯飞、新浪微博、路特斯和潞晨科技等人工智能企业的技术高管,围绕多模态、AIGC、大模型训练等展开了前沿分享和深度对话。
2023世界人工智能大会AI开发者论坛现场
主题演讲,大咖云集
01
可信联邦学习与开源生态
加拿大工程院及加拿大皇家学院两院院士、
FATE开源社区技术指导委员会主席 杨强
加拿大工程院及加拿大皇家科学院两院院士、FATE开源社区技术指导委员会主席杨强表示,如何使联邦学习平衡优化以达到安全可信和高效高质的效果,并且和大模型无缝衔接,是今后产业和学界关注的重点。大模型想要真实落地,其所需的数据是高度分散且复杂的,并与隐私保护以及法律监管密切相关。在业界对联邦学习进行使用和讨论时,隐私保护和算法效率之间相互矛盾又彼此牵扯,想实现多目标优化,就需要相应的数学工具和理论推导来保证,这些就是可信联邦学习建立的基础,而开源社区是可以将理论转化为实践的一个有力工具。
2018年,国内引进了联邦学习( )概念。联邦学习是一种机器学习技术,可以在不交换数据样本的情况下,在多个分散的边缘设备或服务器上训练算法。FATE开源社区则是全球领先的隐私计算联邦学习开源社区,其提供了核心的算法库与多种软件层,可以实现企业异构平台的互联互通,能在不同的本地云之间进行跨云合作,已在多中心医疗机构中投入使用。
利用联邦学习有助于解决大模型应用的两大瓶颈问题:一是构建和使用大模型时的数据隐私保护问题,包含训练数据和微调阶段的本地数据泄露风险;二是公域数据稀缺和可用数据数量不足的问题。未来可在保护数据隐私的前提下,合规合法地利用手机、汽车等终端设备上的私域数据。
02
生成式人工智能:从单模态迈向多模态
加拿大工程院外籍院士、IEEE/IAPR/CAAI 、
.ai创始人兼首席执行官 梅涛
加拿大工程院外籍院士、IEEE/IAPR/CAAI 、.ai创始人兼首席执行官梅涛提出,在此前的人工智能浪潮中,机器人在人脸识别、物体识别、语音识别等方面的发展已经较为成熟,而对于机器人是否能够具有学习、思考乃至行动能力的探索,是未来人工智能发展中重点关注的内容。人工智能的范式由以往的判别式升级为现在的生成式,即由对算法的注重转变为对创造力的追求。这种从单模态迈向多模态的转变,正重塑着我们的生活,也重塑着各个行业和产业的现状。
梅涛表示,目前多模态发展面临着以下几个挑战:一是尚难以完美达成细节上的对齐,二是AI对于人类认知的理解存在偏差,三是确定性问题难以解决。当前的生成式AI视觉领域产品普遍存在可优化空间,而梅涛于2023年3月成立的生成式AI公司.ai则希望围绕视觉,打造生成式多模态基础模型及应用。目前,.ai在图片生成、素材特写、模特换装、商品摄影等领域都产出了新成果,尤其在视频生成领域上做到了业界领先。未来,.ai将在视觉的多模态探索领域持续深耕,以提高人工智能的创造力。
03
大模型时代的AI原生研发模式
百度技术委员会主席 吴华
百度技术委员会主席吴华分享了自己对大模型时代AI原生研发模式的见解。此前的AI模型需要每个使用者进行单独训练,且模型之间的能力无法共享。随着大模型以及预训练技术的发展,AI模型可以满足特定的应用需求并共享一些基本能力,包括文本理解和生成能力,乃至多模态的能力。
大模型的学习方式与人类的学习方式相似,首先是构建一种先天的学习机制,其中包含多个网络基础变形框架;在此基础上进一步构建语言学习机制和底层通用能力,通过与环境进行不断交互,让模型习得基本的理解、生成、规划与推理等能力。
在大模型具有基本通用能力后,AI便进入了一种新的原生研发模式,可将其他工具与大模型相结合来满足使用者的需求,或用现有模型的能力来构建所需工具等。例如,在“文心一言”的web端中有一个名为的插件,它可以支持在PDF和Word等长文档中进行问答及生成摘要。在对长文档的处理中,将通用大模型的原生能力(如摘要和阅读理解能力)与传统工具(如文档解析)结合在一起,形成了新型的AI原生研发模式。
04
大语言模型大规模应用的挑战与机遇
微软 Group技术负责人 蔡玮鑫
微软 Group技术负责人蔡玮鑫分享了团队在 中构建第一波大语言模型应用程序过程中收集到的关键知识,并对大语言模型大规模应用面临的挑战与机遇发表了自己的见解。大语言模型(LLM)是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本和理解语言文本。该类模型可以处理多种自然语言任务,如文本分类、问答、对话等,我们所熟知的便是其中一种。
现有的大语言模型在一次性文本生成中,常常会面临幻觉问题、自洽性问题和离题倾向的挑战,因此通过对话来创作文本具有较高的难度。蔡玮鑫认为,GPT-X本身并不是解决该问题的方案。他的团队与微软雷蒙德研究院的 、麻省理工学院的Felix和华盛顿大学的Zeqiu进行了合作研究,解决了交互体验的三个关键问题:基于命令的编辑模型,模拟用户编辑命令,以及文本草稿的自动生成。
这种交互式文本生成的方法将人类与机器智能的优势进行了结合。人类擅长捕捉语言中的微妙细节,并注意核实重要信息的真实性;机器擅长自动化,能够激发用户的创造性。交互式文本生成通过将写作过程模式化为对话的方式,让用户控制文本生成结果并参与到模型学习中,使得模型的准确性、实用性和安全性都有所提高。这是未来将大语言模型应用引入到高风险领域(如医疗与法律)的关键。
云帆AI青年之声:
范式转变中的机遇和挑战
WAIC云帆奖于2020年发起设立,由机器之心、全球高校人工智能学术联盟和AI青年科学家联盟等负责评选及运营,是全球首个针对青年AI技术人才的奖项,致力于发掘和激励人工智能领域最具潜力的青年技术人才。在此次AI开发者论坛中,机器之心副主编闻菲与三位历届云帆奖得主(李诚、孟怀宇、谢知遥)展开圆桌对话,共同讨论了AI范式转变当中的机遇与挑战。
圆桌对话主持人闻菲与嘉宾李诚、孟怀宇、谢知遥(从左至右)
谈及如何从自身视角关注大模型的发展趋势,中国科学技术大学副教授李诚认为,这个时代的AI红利来自于大算力、强算法和海量数据,而在目前的AI范式转变中,编译器占据了十分重要的地位,其能将人类语言写成的程序翻译成机器的指令去执行,这是国产AI芯片生态中最重要的一个环节。张江企业曦智科技的联合创始人、首席技术官孟怀宇表示,在此之前,算力的发展已被自然规律限制住,是否能够打破“摩尔定律”是目前业界需要思考的话题。香港科技大学助理教授谢知遥关注的则是在应用机器学习算法时如何解决芯片设计和生产过程中遇到的具体问题。
云帆奖得主揭晓
WAIC云帆奖每年4月开始征集,并在当年的WAIC开发者论坛上公布。在本次开发者论坛上,最新一届的WAIC云帆奖得主名单揭晓。本届云帆奖获奖者包含10位“璀璨明星”和15位“明日之星”,其中既有来自海内外著名高校的青年教师及博士后研究员,也有参与创立了新一代AI企业的青年实干家,专业领域集中在大模型技术、自然语言处理、智能决策、系统架构、可信AI和数据安全等。
云帆奖璀璨明星获奖者海报
云帆奖明日之星获奖者海报
其中,“璀璨明星”获奖者包括清华大学自动化系助理教授封硕、复旦大学自然语言处理实验室副研究员桂韬、中国科学技术大学计算机学院副教授李诚等,“明日之星”获奖者包括上海人工智能实验室青年研究员陈立、伦敦国王学院助理教授杜雅丽、新加坡国立大学研究员费豪等。
2023 WAIC云帆奖璀璨明星颁奖典礼
2023 WAIC云帆奖璀璨明星获奖代表 李永露
上海交通大学长聘教轨助理教授、博导李永露作为获奖代表进行发言,他表示,云帆奖对于青年AI技术人才是一个很好的鼓励,期待未来有更多“璀璨明星”和“明日之星”出现,共同推进AI领域的发展。
2023年是AI范式转变的关键一年,除了大模型外,AI领域还有许多问题值得深入探究。期待未来能够涌现更多的先进人才,为AI技术的发展带来新的思路与可能性,促进AI在生产生活中更多场景的实际应用。