WAP手机版 RSS订阅 加入收藏  设为首页
大发app唯一官网
当前位置:首页 > 大发app唯一官网

大发app唯一官网:模型和框架都是独立开发的

时间:2021/7/12 14:25:16   作者:   来源:   阅读:22   评论:0
内容摘要:“子洞太初”平台是以多模态大型模型为核心,以全栈本地化基础软硬件平台为基础,支持全场景人工智能应用的跨模态通用人工智能平台。“所谓的跨模态是指能够理解语音、文字、图片等多种模态信息;所谓的全栈本地化意味着这个平台的底层计算能力、模型和框架都是独立开发的。”徐波解释道。多模态预训练模型被广泛认为是从弱人工智能的有限领域向...

“子洞太初”平台是以多模态大型模型为核心,以全栈本地化基础软硬件平台为基础,支持全场景人工智能应用的跨模态通用人工智能平台。“所谓的跨模态是指能够理解语音、文字、图片等多种模态信息;所谓的全栈本地化意味着这个平台的底层计算能力、模型和框架都是独立开发的。”徐波解释道。

多模态预训练模型被广泛认为是从弱人工智能的有限领域向普通人工智能的探索。自动化研究所依托超大规模、高效的分布式训练框架,构建了行业领先的中文预训练模型、语音预训练模型和视觉预训练模型,并首创跨模态语义关联,实现视觉和文本,语音三种模式统一,构建了一个大型的三模态预训练模型,为多模态通用人工智能平台提供了多种核心能力。

徐波认为,“紫东太初”既有跨模态的理解能力,又有生成能力。相比单模态和图文两种模式,《子洞太初》采用大型模型,灵活支持图文语音的全场景AI应用,具有无监督条件下的多任务联合学习。,以及快速迁移到不同领域数据的强大能力。

“引入语音模态的多模态预训练模型,可以实现常见图片、语音和文本的空间表征和利用,直接实现三种模态的统一表征。”徐波说,这值得强调。是的,该平台首次实现了“图像产生声音”和“图像由声音产生”的现实,为更广泛、更多样化的下游任务提供基于模型的支持,允许人工智能为视频、语音广播、标题摘要和海报配音。在更多的场景中实现应用程序,比如创建。


相关评论
本站所有站内信息仅供娱乐参考,不作任何商业用途,不以营利为目的,专注分享快乐,欢迎收藏本站!
所有信息均来自:百度一下 (大发官方网址)