全球1000+研究员在Twitter直播训练超大模型??(3)
扫一扫
分享文章到微信
扫一扫
关注99科技网微信公众号
因此,来自世界各地的大量研究人员在其中共同训练大型语言模型(LLM),一切完全公开,任何人都可以参与,所有研究成果都与整个社区共享。
BigScience作为一个跨学科的研讨会,汇聚了人工智能、社会科学、法律、伦理等多种研究领域的学术和工业界的研究人员,集中时间和资源共同实现更大的影响。
BigScience成为AI历史上第一个超过1000多名研究人员参与创建单一模型和数据集的案例,继而,BLOOM也成为目前第一个也是唯一一个在这种规模上创建的完全开源的大型语言模型。
在笔者看来这是一个翻版“石头汤”的故事,每个人都往大锅中加入自己拥有的食材并成功制作了一份美味的汤给大家分享。
BigScience成立了一个特别大的Slack频道:TLDR,并将团队分为多个工作组,包括法律、数据管理、模型管理、模型架构和训练以及模型可视化等。
每个小组都由志愿者主席组成,他们负责组织会议、设定截止日期和确保相关代码和论文写作按时完成。
HuggingFace团队主导,Microsoft DeepSpeed团队和NVIDIA Megatron-LM团队提供了并行训练架构,由核能驱动的超级计算机Jean Zay提供了低碳环保的算力支持... 哇,这将会呈现给AI社区每一个人的绝美的汤!
一些感想进一步,像BigScience一样协作训练并共享大型语言模型是一个相当有趣的尝试,在之前我们看到类似大小的模型在各种大型科技公司中训练并保持私有,这产生了重复的能源消耗并几乎没有实用逻辑。
同样的,我们也看到了以开源著称的HuggingFace更加蓬勃的“野心”,其牵头成立的BigScience无畏的走向了更加开源、开放的时代浪尖。
更为有意思的是,BigScience使用中国儒家道德理论中的“和”作为其道德章程的根基,建立起包容性、多样性、开放性等构成的内在价值观以及透明性、跨学科性等组成的外在价值观。
BigScience要求成员按照其道德章程建立核心价值观,并希望能够进一步出版、传播和普及来促进学术界的价值观。
按照其章程,笔者构画了BigScience设想的蓝图:这里没有宗教、种族、性别等任何形式的歧视并希望每个成员对BigScience有归属感,每个贡献者都肩负着个人责任以及集体责任,既要对社会负责也要对环境负责,多学科交融互通,多语种美美与共。
BigScience作为刚刚燃起的“星星之火”,不管能否燎原,它用全新的合作形式,完全开源、平等包容的价值观让我们看到了人工智能时代不一样的色彩。
99科技网:http://www.99it.com.cn

近日,MetaAI发布了NLLB-200模型,宣布在200多种语言(其中有70%是低资源语言)上
元宇宙2022-08-31
