主页 > 快资讯 > 正文

没有这些，别妄谈做ChatGPT了(2)

2023-03-01 09:31来源：未知编辑：admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

有人可能要说，那我们训一个小点的模型，比如百亿参数的，可行吗？

目前来看不可行。 AI的表现并非随着模型规模增加而线性增加，而是在参数规模超过特定临界值后显著提升，甚至涌现出小模型不具备的能力。比如论文表明，模型的规模至少要达到620亿参数量后，才可能训练出来思维链（Chain-of-Thought，CoT）能力。如下图所示：

而像Truthful（可信的）这种能力，甚至ChatGPT/GPT-3这样的模型规模都是不够的，要达到2800亿参数量才能涌现出这样的能力。是的，复现和超越ChatGPT，目前来看没有捷径，必须一步一步来，首先要先把GPT-3搞定。

国内有人真正复刻了GPT-3？

是的，有且只有一家，阿里达摩院，他们从小到大（从base到175B），全面、完整地复刻了GPT-3，并且开放在魔搭社区上。

https://modelscope.cn/models/damo/nlp_gpt3_text-generation_chinese-large/summary

达摩院的复刻不是没有来由的，他们应该在大模型各个方向都进行了探索，布局完整。早在2021年4月就发布了首个中文语言大模型PLUG（当时参数是270亿）。该模型首次在中文语言理解榜单CLUE上面，以86.685分的成绩超越人类。

同年10月份，达摩院还探索实现了 10万亿参数模型——M6 ，达摩院团队通过大量的底层优化和算法设计，仅仅使用了512卡便实现了这一庞大的模型工程。此前，M6模型将AI图片生成清晰度从OpenAI DALL·E的256×256成功提升到了1024×1024，效果十分惊艳。

M6模型的发布引发了国内外的大量关注，其中，OpenAI前政策主管Jack Clark公开点评：“这个模型的规模和设计都非常惊人。这看起来像是众多中国的AI研究组织逐渐发展壮大的一种表现。”

从达摩院的经历我们基本可以判断：如果一个研发团队此前没有训练过千亿级别的大型语言模型，那就很难在可以接受的时间窗口内训练出真正具备生产力价值的类ChatGPT模型。

不过，我们也要看到，算法可能只是硬币的一面，另一面是算力和云基础设施，不容忽视。

云基础设施

OpenAI的解决方式是向微软求助。同样的道理，国内如果有初创企业想要成为中国版OpenAI，自研ChatGPT，恐怕也要先跟几个云计算厂商好好聊一聊了。

没有做过大模型训练的人，可能会误以为多买几张A100卡就可以了。

当你实操的时候，你就会发现：

99科技网：http://www.99it.com.cn

共4页:

2

相关推荐

AI文章挤爆投稿邮箱！刊龄17年杂志被迫暂停征稿，“这些人就是为赚快钱”

AI文章挤爆投稿邮箱！刊龄17年杂志被迫暂停征稿，“这些人就是为赚快钱”

ChatGPT大火，却把知名科幻杂志气到“掀桌子”了。

快资讯2023-02-23

球探即时比分:拉比奥：尤文没有主力替补之分；客战里昂会很困难

球探即时比分:拉比奥：尤文没有主力替补之分；客战里昂会很困难

在尤文图斯主场2-0击败布雷西亚之后，拉比奥在接受采访时强调，他们可以进一

快资讯2022-11-21

C盘清理瘦身扩容搬家没有效果？磨针一键永久解决C盘问题

C盘清理瘦身扩容搬家没有效果？磨针一键永久解决C盘问题

您在使用windows的过程中是否经常碰到以下问题： 1、C管不管多大，总会变红、

快资讯2022-11-08

Hinton、Yann LeCun、李飞飞谈深度学习十年：AI没有走入死胡同，“革命”仍如火如荼

Hinton、Yann LeCun、李飞飞谈深度学习十年：AI没有走入死胡同，“革命”仍如火如荼

Geoffrey Hinton是十年前深度学习初创“革命”的开拓者之一。他看来，未来 AI 技

快资讯2022-09-21

AI没有“无人区”

AI没有“无人区”

人工智障和AI艺术家的差距，更多是人工智能中“人”的差距。

快资讯2022-09-21

为何能让年轻女性一见倾心以内X3扫地机器人做到了这些

为何能让年轻女性一见倾心以内X3扫地机器人做到了这些

快节奏的城市中，大多数女性压力大、工作忙，没有太多时间花在家务上。为减

快资讯2022-09-06

AI企业上市困局：秀肌肉时代已远去，还是没有新故事

AI企业上市困局：秀肌肉时代已远去，还是没有新故事

AI企业“上市潮”已然来临，但遗憾的是，资本市场似乎已容不下“烧钱大户”

快资讯2022-08-30

非科班AI小哥火了：他没有ML学位，却拿到DeepMind的offer

非科班AI小哥火了：他没有ML学位，却拿到DeepMind的offer

这两天，DeepMind研究工程师小哥Aleksa Gordić的个人经验贴在Twitter上火了一把。

快资讯2022-08-30

百度计算机视觉首席科学家王井东：在视觉的竞技场，研究与落地没有明显的界限

百度计算机视觉首席科学家王井东：在视觉的竞技场，研究与落地没有明显的界限

在王井东看来，百度搜索引擎、自动驾驶、智能云、小度等等不同的业务线中，

快资讯2022-08-28

iPhone14全家福图片曝光，没有mini版

iPhone14全家福图片曝光，没有mini版

近日，iPhone14突然登上热搜。一海外爆料达人晒出了该机全系四款新机的“全家

快资讯2022-08-13

头条资讯

推荐资讯

最近更新

99科技网—新锐科技媒体！: 关于我们 | 联系我们 | 商务合作; 寻求报道 | 免责声明 | 网站地图; 申请友链 | 加入我们 | 意见反馈

投诉建议: 通过E-mail将您的想法和建议发给我们; 稿件投诉：; 合作网站：99科技网

联系我们: 服务热线：; 官方客服QQ：; 微信公众号：

Copyright © 2009-2022 99科技网—提供有价值的科技领域报道和服务