主页 > 元宇宙 > 正文

首次在智能手机上训练BERT和ResNet,能耗降35%(2)

2022-09-06 11:57来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

图注:POET 在边缘设备上对 SOTA 机器学习模型的训练进行优化。

对于部署在真实世界边缘设备上的模型,当边缘设备出现空闲并可以计算周期时就会进行训练,例如谷歌 Gboard 会在手机充电时安排模型更新。因此,POET 也包含了严格的训练限制。给定内存限制和训练 epoch 的数量,POET 生成的解决方案也能满足给定的训练截止期限。此外,研究者还利用 POET 开发了一个全面的成本模型,并证明它在数学上是保值的(即不做近似),适用于现有的开箱即用架构。

论文一作 Shishir Patil 在演示视频中表示,POET 算法可以在智能手机等商用边缘设备上训练任何需要极大内存的 SOTA 模型。 他们也成为了首个展示在智能手机和 ARM Cortex-M 设备上训练 BERT 和 ResNet 等 SOTA 机器学习模型的研究团队。

集成分页和重新实现

重新实现和分页是降低大型 SOTA ML 模型内存消耗的两种技术。在重新实现中,一旦不再需要激活张量就会被删除,最常见的是在前向传播期间。从而释放了宝贵的内存,可用于存储后续层的激活。当再次需要删除的张量时,该方法会根据谱系的规定从其他相关的激活中重新计算。而分页,也称为 offloading,是一种减少内存的补充技术。在分页中,不是立即需要的激活张量从主存储器调出到二级存储器,例如闪存或 SD 卡。当再次需要张量时,将其分页。

图 2 显示了一个八层神经网络的执行时间表。沿着 X 轴,每个单元对应神经网络的每一层(共 8 层 L8)。Y 轴表示一个 epoch 内的逻辑时间步长。图中占用的单元(用颜色填充)表示在相应的时间步执行的操作(前向 / 后向传播计算、重新实现或分页)。

例如,我们可以看到 L1 的激活是在第一个时间步 (T1) 计算的。在 T2 和 T3 时刻,分别计算 L2 和 L3 的激活量。假设层 L2 和 L3 恰好是内存密集型但计算成本较低的运算,例如非线性 (tanH、ReLU 等),那么重新实现就成为了最佳选择。我们可以删除激活({T3, L2}, {T4, L3}) 来释放内存,当后向传播过程中需要这些激活时,可以再重新实现它们({T14, L3}, {T16, L2})。

99科技网:http://www.99it.com.cn

相关推荐
新科技 新基建 人工智能:开启无限可能 新科技 新基建 人工智能:开启无限可能

人工智能正在对经济发展、社会进步、全球治理等方面产生重大而深远的影响。

元宇宙2022-09-06

中国人工智能软件市场指南 中国人工智能软件市场指南

人工智能(AI)软件是中国企业投资和关注的重点。

元宇宙2022-09-06

全球1000+研究员在Twitter直播训练超大模型?? 全球1000+研究员在Twitter直播训练超大模型??

尽管有些模型开放了API接口或参数,但详尽的技术细节却未公之于众,导致难以

元宇宙2022-09-06

人工智能是不是走错了方向? 人工智能是不是走错了方向?

当前的人工智能发展方向,与人类业界对于人工智能的期待,目前来说,大体上

元宇宙2022-09-06

Web3正在推动一个41万亿元的市场? Web3正在推动一个41万亿元的市场?

到2023年,Web3.0区块链技术领域的价值将超过6万亿美元。

元宇宙2022-09-01

明略科技CTO郝杰:会话式AI应该是“静悄悄”的辅助智能 明略科技CTO郝杰:会话式AI应该是“静悄悄”的辅助智能

AI 一定要落在实处,一定要追求它能落地成功。不要做飘在天上的“阳春白雪”

元宇宙2022-08-31

三年亏7亿,智能语音老将思必驰拟上市“补血” 三年亏7亿,智能语音老将思必驰拟上市“补血”

业务的扩张带来2021年的期间费用率的暂时上升及亏损比率扩大,但未来业务的

元宇宙2022-08-31

唐诗、东北话、谐音梗……人工智能还有什么是不能翻译的吗? 唐诗、东北话、谐音梗……人工智能还有什么是不能翻译的吗?

数字化时代,全球经济、文化的壁垒正在被打破,而语言上的无障碍交流沟通,

元宇宙2022-08-31

新公链们的叙事 新公链们的叙事

至于技术方面,它们的方案也并没有太大的颠覆性创新,依旧在以太坊创立的框

元宇宙2022-08-31

英伟达挖矿史:“把这一代最优秀的工程师聚在一起,然后研究挖比特币” 英伟达挖矿史:“把这一代最优秀的工程师聚在一起,然后研究挖比特币”

如果问各大科技公司,英伟达这家公司最让人羡慕的地方是什么,“不受周期限

元宇宙2022-08-31