ChatGPT掀智力革命!OpenAI发布AGI路线图,通向超级智能世界
扫一扫
分享文章到微信
扫一扫
关注99科技网微信公众号
继ChatGPT成当红炸子鸡后,微软、谷歌、Meta等大厂纷纷入局。 随之而来的是,人们对其广泛应用也产生了担忧。 前Alphabet执行董事Eric Schmidt和其他合著者在WSJ发表的文章中称,
生成式人工智能提出了自启蒙运动以来从未经历过的哲学挑战和实践挑战。
就在昨日,OpenAI首席执行官Sam Altman发文,分享了OpenAI对通用人工智能(AGI)的当前和后续规划。 文章强调,OpenAI的使命是确保AGI造福全人类。
OpenAI愿景:确保AGI造福全人类
文中,提出了OpenAI最关心的三原则。 如果AGI最终成功构建,这项技术不仅可以带来更多可能性,推动全球经济发展,还能改变新兴科学知识的发现,从方方面面帮助人类提升生活水平。 AGI可以赋予每个人不可思议的新能力。 在AGI触手可及的世界,所有人都可以获得几乎所有认知能力的帮助,AGI或许能成为人类才智和创造力的巨大力量增幅器。
但另一方面,正如一些人所担心的,通用人工智能也会造成严重的滥用、意外和社会混乱。 然而,AGI的益处令人惊叹,我们不能讳疾忌医,让社会永远停止发展;相反,社会和AGI开发者必须要想办法把它做好。 与通用人工智能共同生活的未来图景难以预测,当前AI的进展可能会遭遇新的挑战,但在ChatGPT获得成功的当下,我们列出了公司最关心的几项原则: 1. 希望AGI可以为人类赋能,使人类能够在宇宙中实现最大程度的繁荣。我们不希望未来成为一个虚假的乌托邦,但我们希望将技术好的一面最大化,坏的一面最小化,让AGI成为人类善意的放大器。 2. 希望以公平的方式,更广泛地分享AGI的益处、获取和治理。 3. 要正确应对潜在风险。在面对这些风险时,理论上似乎正确的事情在实践中往往比预期更难以控制。我们必须通过部署功能较弱的技术版本来不断学习和适应,以最大程度地减少「无可挽回」的情况。
短期目标:为AGI做好三项准备
因此在短期内,OpenAI计划做到以下几件事。 首先,随着公司不断构建出更为强大的AI系统,我们希望快速部署AGI,以积累在相应的应用经验。 在OpenAI看来,谨慎管理AGI的最佳方式应该是逐渐过渡到AGI普及的世界。我们期望的未来,强大的人工智能技术能够加快世界进步的速度, 渐进的方式让大众、政策制定者和研究机构有时间了解AGI技术带来的改变,亲身体验这些系统的好处和缺点,调整经济组织形式,并实施有效监管。 同时,渐进的发展方式还能促使社会和AI共同进步,让人们在风险相对较低的情况下了解自身。 OpenAI认为,成功解决AI应用挑战的最佳方法是采用快速学习和谨慎迭代的紧密反馈循环。在新技术的冲击下,社会将面临「人工智能系统被允许做什么、如何消除偏见、如何处理工作岗位流失」等重大问题。 增加AI技术的使用大有裨益,OpenAI希望成为推广该技术的一员,通过将模型放入服务API中,将它们开源等方式实现。 OpenAI表示,随着其开发的系统越来越接近AGI,该机构在模型的创建和部署方面都变得越来越谨慎。 OpenAI需要权衡使用大模型的利弊。一方面,使用先进的大模型标志着重要的科技进展;另一方面,使用模型之后,公司和机构也需要考虑如何限制恶意行为者、避免对社会和经济造成不良影响等问题。 其次,OpenAI正在努力创建更加一致和可控的模型。从GPT-3的第一个版本到InstructGPT和ChatGPT,这一步步的转变都彰显OpenAI在AI安全性方面所做的努力。 值得注意的是,人类社会需要就如何使用人工智能达成极其广泛的界限。随着模型变得更强大,OpenAI将需要开发新的对齐技术。 OpenAI的短期计划是使用AI来帮助人类评估更复杂模型的输出并监控复杂系统,而从长远来看,OpenAI将会使用AI来帮助获得更好的对齐技术。 OpenAI认为,人工智能安全和能力同样重要,二者不应该分开谈论。OpenAI表示其最安全的工作出自其最有能力的模型之手。也就是说,提高人工智能的安全性对AI研究进步非常重要。 第三,OpenAI 希望全球范围内解决三个关键问题:人工智能系统的治理问题,AI系统产生的收益的分配问题,以及访问权限的共享问题。 此外,根据OpenAI公司章程,OpenAI需协助其他组织提高安全性,不能在后期AGI开发中与对手竞争。 OpenAI投资规则中对股东可以获得的回报设定了上限,这样研究机构本身就不会被引诱去尝试无限制地获取价值,也不会冒险使用具有灾难性危险的技术。 OpenAI由非营利组织管理,以保证该机构是为人类的利益而运行,并且可以凌驾于任何营利利益之上。 最后,OpenAI认为全球政府应对超过一定规模的机器学习训练保持监管。
99科技网:http://www.99it.com.cn

ChatGPT中有这样一个 核心训练方法 ,名叫“ 人类反馈强化学习 (RLHF) ”。
快资讯2023-02-28
