投稿问答最小化  关闭

万维书刊APP下载

“魔搭”是啥?一键用上大模型的“魔法”

2022/11/11 14:43:27  阅读:189 发布者:

文|赵广立

众筹买车,众筹买房,你听说过有众筹“大模型”的吗?

这事儿还真发生过,就在不久前。

一个“众筹”故事

20215月,近千名不同国籍、不同专业领域的科学家和志愿者就发起了一项众筹大模型的项目。为何如此兴师动众?这得从大模型的应用说起。

大模型全称“人工智能预训练大模型”。称之为“大”模型,是因为相比普通AI模型,它拥有海量训练数据、超大规模参数,可以应对多种场景下的任务。

如果说开发一个AI模型相当于做一道菜,AI大模型就像是提供“预制菜”,简单加热即食。如此可大大节约时间成本,减少开发AI模型从01开发过程中的重复性劳动。

然而,由于训练大模型所费不菲,绝大多数AI大模型都掌握在科技大厂或专门机构手中,普通学者和开发者的访问权限有限。于是这些科学家就想到了众筹的方式,共同搞出一个开源开放的AI大模型,方便大家使用和科学研究。

这件事儿还真做成了。一年多时间,这个项目收到了约700万美元的公共资助,创建了一个参数规模1760亿的多语言模型,与知名的GPT-3规模相当。这个大模型就是“BLOOM”。据称,从代码到数据集,BLOOM全部对外开放,所有人都可下载使用。

然而,据了解,下载和使用BLOOM,需要具备一定的本地硬件能力,因此如今BLOOM尚只供一些大研究团队使用。而且,从BLOOM数据集来看,它作为包括46种语言的多语言模型,中文数据集容量尽管占比较大,但也只有约16.25%(含繁体中文),并不太方便中国科学家和开发者使用。

中文AI研究者对大模型有着同样的渴求,进而推动中文AI的研究与应用。特别是,眼见近两年大模型越来越多、参数规模越来越大,从外面看却越来越曲高和寡。这些大模型能不能开源开放出来?

不用众筹、不用等待,随着“魔搭”在2022云栖大会的亮相,这一天,来了。

达摩院“倾囊相授”

113日,2022云栖大会杭州现场传来好消息:阿里达摩院联手CCF开源发展委员会共同推出AI模型社区“魔搭”ModelScope,旨在降低AI的应用门槛。作为发起者,达摩院率先向魔搭社区贡献300多个经过验证的优质AI模型,超过1/3为中文模型,全面开源开放,并把模型变为直接可用的服务。

对于众多AI研究者、开发者和爱好者而言,这好比“刚要打瞌睡就有人递枕头”。

为了建好魔搭社区,达摩院率先贡献的300多个模型,包括了自然语言处理、视觉、语音、多模态等各个智能方向上150多个业界领先的模型,很多是预训练的多模态大模型,如达摩院之前公布的通义大模型系列。

阿里达摩院这波操作可谓诚意满满。迄今为止,放眼全球,还没看到任何一家机构或科技企业将如此规模的大模型免费开源供开放使用。用阿里巴巴集团资深副总裁、达摩院副院长周靖人的话来说,“达摩院这次是倾囊相授了”。

“如果说今天我们有一些保留,那其实这件事情你就做不成。”周靖人在受访中表示,“我们希望起个好头,就得把自己最好的模型能够拿出来。”

搭建魔搭社区,达摩院不是单干。在社区首批合作机构中,深势科技、澜舟科技、智谱AI、中国科学技术大学等都参与其中。

相应地,深势科技的蛋白质序列预测模型Uni Fold Monomer、澜舟科技的孟子系列语言大模型、智谱AI的多语言预训练模型等也“进驻”了魔搭社区。

此外,中国科技大学、浙江大学还与魔搭社区共同探索AI人才培养等系列合作。周靖人说,非常希望能够跟国内的相关的学者、开发者,一起来共建社群。

据介绍,魔搭社区开放的模型均兼容多种主流AI框架,支持多种训练与服务部署方式,用户可根据偏好自主选择。此外,社区面向所有开发者开放,将实行理事会管理,旨在推动AI大规模应用,不以盈利为目标。

这样一个AI模型共享共进的开源社区,对于开发者和爱好者而言,意味着“花开堪折直须折”,而从测评阶段收到的反馈来看,也确实如此。

“社区里面的模型实在是太多了,简直是学生党的福音!”一位学生开发者在魔搭社区测评阶段就参与其中,感到自己生逢其时:“一些课堂学的内容,我们在课下进行练习时总会觉得无从下手,老师就跟我们说去试试这个新社区。”

在魔搭社区,他最先搜索使用了声码器模型HIFI-GAN,这是一种使用场景丰富的训练模型,适用于中文语音合成场景,如配音、虚拟主播、数字人等等。在使用过程中,他也感受到了社区的强大:“总能很直接地指出我在操作中出现的错误,节省了我很多时间去查找错误漏洞。”

周靖人在 2022 云栖大会上介绍魔搭社区

MaaS理念下的社区

周靖人提出,AI技术的开发和应用,模型是一个载体。“使用门槛过高限制了AI的潜能。”为了加快突破AI应用难题,阿里达摩院认为,要围绕模型去搭建相应的服务体系,在开源大模型的基础上,他们提出了“Model as a Service”(MaaS,模型即服务)概念。

从提供模型到围绕模型提供各种各样的服务,这就是MaaS的核心理念。周靖人说,开源社区建设最大的挑战是,让更多的人参与到社区建设,更多的开发者能通过社区解决实际问题,积极使用、积极反馈。因此,必须基于MaaS理念,在“社区友好度”上做文章。

如此说如此做。首先,魔搭社区在中文AI模型的丰富供给方面自不多言,目前已上架的中文模型超过100个,能够更好地满足本土需求;其次,魔搭社区重点提供了易用的模型使用平台,让AI模型跑起来不再困难——从代码下载到二次开发、从安装部署再到效果验证,以前往往需要数天,现在只要几个小时甚至几分钟。

此外,通过全新开发的调用接口和统一的配置文件,平台提供模型探索、环境安装、推理验证、训练调优等一站式服务。在线0代码就可体验模型效果,1行代码可实现模型推理,10行代码实现模型调优和定制。同时,平台还提供了在线开发功能和算力支持,无需任何安装部署,打开网页就可以开发AI模型。

“魔搭ModelScope就是在MaaS理念下的一个社区。”周靖人认为,MaaS理念建立起了一个以模型为中心的、全生命周期的管理机制,这意味着给开发者提供一系列的支持。唯有如此,才能快速地把模型从一个开发环境变成一个生产环境,快速地将模型与场景业务相链接、有交互。

MaaS是未来人工智能发展的重要方向,如果能实践好,将促进AI产业界的大发展。”周靖人说。

不是里程碑,只是一个起点

2022云栖大会现场,中国科学院院士、中国计算机学会(CCF)开源发展委员会主任王怀民感叹:希望AI模型的开源开放,能够在市场、社会、政府力量共同作用下,建成一个“国家图书馆”。

他表示,开源是AI发展的重要驱动力,魔搭社区作为新型的AI开源社区,不仅将有力推动AI迈向广泛的落地应用,还将助力中国从开源世界的参与者逐步成长为引领者。

中国科学院院士、北京大学教授鄂维南认为,魔搭社区是为AI for Science这一全新科研范式提供通用研究工具的一个重要尝试,有利于推动科研从“小农作坊”模式转变到“安卓”模式,避免重复性工作,倒逼原始创新研究。

对比文章开头国外学者发起的众筹行为,魔搭社区的横空出世,无疑堪称中文AI产业领域的一件盛事。然而,即便为此兴奋不已,周靖人也强调社区的发布不是一个“里程碑”,而是“一个起点”。

“因为今天我们需要共同搭建基于MaaS的模型生态,不断丰富和完善模型服务。”周靖人透露,按照当前的态势,他预计魔搭社区每个月都会有新的模型上线,很快模型数量会翻倍,并覆盖到各个应用领域的方方面面。

“我们只是牵了个头,会不断去发布新的模型;希望更多开发者一起来贡献,让社区转起来、模型‘玩’起来,进而发挥AI大模型的无限潜力。”周靖人说。

魔搭社区地址:modelscope.cn(阅文原文可直接访问)

转自:“科学网”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com