鹏城实验室、百度联合发布全球首个知识增强千亿大模型鹏城-百度·文心_科研进展

鹏城实验室、百度联合发布全球首个知识增强千亿大模型鹏城-百度·文心

时间：2021-12-09 点击：5405

作为当前人工智能发展的重要方向，预训练大模型已成为AI领域的技术新高地。12月8日，鹏城实验室与百度联合召开发布会，正式发布双方共同研发的全球首个知识增强千亿大模型——鹏城-百度·文心（模型版本号：ERNIE 3.0 Titan）。该模型参数规模达到2600亿，是目前全球最大的中文单体模型，在60多项任务上取得最好效果。同时，百度产业级知识增强大模型“文心”全景图首次亮相，从技术自主创新和加速产业应用两方面，推动中国人工智能进一步发展。

现场，中国工程院院士、鹏城实验室主任高文，百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰共同启动发布仪式。

中国工程院院士、鹏城实验室主任高文（左），百度首席技术官王海峰（右）联合发布鹏城-百度·文心

高文院士在致辞中表示，“预训练模型对整个科学的发展、社会的发展、创新的发展都是非常重要的工具。它可以帮助做很多人工智能的赋能，不局限于某个领域，这对人工智能的发展都是一个福音。”

王海峰介绍，鹏城-百度·文心知识增强大模型从大规模知识和海量数据中融合学习，效率更高，效果更好，具有良好的可解释性。

值得关注的是，鹏城-百度·文心是全球首个知识增强千亿大模型，在机器阅读理解、文本分类、语义相似度计算等60多项任务取得最好效果，并在30余项小样本和零样本任务上刷新基准。为解决大模型应用落地难题，研究团队还首创了大模型在线蒸馏技术，模型参数压缩率可达99.98%。压缩版模型仅保留0.02%参数规模就能与原有模型效果相当，为产业大规模应用打开了新窗口。

使用鹏城-百度·文心进行可信、可控文本生成

在鹏城-百度·文心的研发过程中，得益于鹏城实验室的高性能AI算力系统“鹏城云脑Ⅱ”和飞桨深度学习平台强强联手，解决了超大模型训练的多个公认技术难题，使鹏城-百度·文心训练效率大幅提升，模型效果更优。“鹏城云脑Ⅱ”是国产自主的首个E级AI算力平台，曾在多个国际性能测试上获得冠军。飞桨是我国首个自主研发的深度学习开源开放平台，研制了端到端自适应分布式训练框架，实现多硬件支持，并行效率高达90%，有效支持鹏城-百度·文心千亿大模型高效、稳定地训练。另外，“鹏城云脑II”技术团队也与华为团队一同对大模型训练给予了持续保障。

为促进产学研协“多轮驱动”，鹏城实验室与百度成立了鹏城-百度自然语言处理联合实验室，以此为依托，实现资源共享、优势互补，在自然语言处理前沿研究和创新应用方面协同攻关，助力打造国家战略科技力量。此次联合发布的鹏城-百度·文心将进一步解决 AI 技术在产业应用中缺乏领域和场景化数据等关键难题。本着“开源开放”的理念，该模型相关代码近期会在OpenI启智社区开源，并依托“鹏城云脑Ⅱ”对外开放，联合产学研协各方，充分挖掘AI大模型的赋能能力，助力科技创新，推动产业发展。

撰稿：网络智能研究部赵海英

主任寄语

研究部门

联系我们

科研进展

科创专项

专利与标准

重大科技基础设施与开放平台

对外合作

学术讲座

科协活动

基金会

党建工作

鹏城清风

群团活动

招生工作

培养管理

师生风采

规章制度

图书资源

鹏城实验室

联系我们