首次在智能手机上训练BERT和ResNet，能耗降35%(2)

2022-09-06 11:57来源：未知编辑：admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

图注：POET 在边缘设备上对 SOTA 机器学习模型的训练进行优化。

对于部署在真实世界边缘设备上的模型，当边缘设备出现空闲并可以计算周期时就会进行训练，例如谷歌 Gboard 会在手机充电时安排模型更新。因此，POET 也包含了严格的训练限制。给定内存限制和训练 epoch 的数量，POET 生成的解决方案也能满足给定的训练截止期限。此外，研究者还利用 POET 开发了一个全面的成本模型，并证明它在数学上是保值的（即不做近似），适用于现有的开箱即用架构。

论文一作 Shishir Patil 在演示视频中表示，POET 算法可以在智能手机等商用边缘设备上训练任何需要极大内存的 SOTA 模型。他们也成为了首个展示在智能手机和 ARM Cortex-M 设备上训练 BERT 和 ResNet 等 SOTA 机器学习模型的研究团队。

集成分页和重新实现

重新实现和分页是降低大型 SOTA ML 模型内存消耗的两种技术。在重新实现中，一旦不再需要激活张量就会被删除，最常见的是在前向传播期间。从而释放了宝贵的内存，可用于存储后续层的激活。当再次需要删除的张量时，该方法会根据谱系的规定从其他相关的激活中重新计算。而分页，也称为 offloading，是一种减少内存的补充技术。在分页中，不是立即需要的激活张量从主存储器调出到二级存储器，例如闪存或 SD 卡。当再次需要张量时，将其分页。

图 2 显示了一个八层神经网络的执行时间表。沿着 X 轴，每个单元对应神经网络的每一层（共 8 层 L8）。Y 轴表示一个 epoch 内的逻辑时间步长。图中占用的单元（用颜色填充）表示在相应的时间步执行的操作（前向 / 后向传播计算、重新实现或分页）。

例如，我们可以看到 L1 的激活是在第一个时间步 (T1) 计算的。在 T2 和 T3 时刻，分别计算 L2 和 L3 的激活量。假设层 L2 和 L3 恰好是内存密集型但计算成本较低的运算，例如非线性 (tanH、ReLU 等)，那么重新实现就成为了最佳选择。我们可以删除激活({T3, L2}， {T4, L3}) 来释放内存，当后向传播过程中需要这些激活时，可以再重新实现它们({T14, L3}， {T16, L2})。

99科技网：http://www.99it.com.cn

共4页:
上一页
1
2
3
4
下一页

相关推荐

新科技新基建人工智能：开启无限可能
人工智能正在对经济发展、社会进步、全球治理等方面产生重大而深远的影响。

元宇宙2022-09-06

中国人工智能软件市场指南
人工智能（AI）软件是中国企业投资和关注的重点。

元宇宙2022-09-06

全球1000+研究员在Twitter直播训练超大模型？？
尽管有些模型开放了API接口或参数，但详尽的技术细节却未公之于众，导致难以

元宇宙2022-09-06

人工智能是不是走错了方向？
当前的人工智能发展方向，与人类业界对于人工智能的期待，目前来说，大体上

元宇宙2022-09-06

Web3正在推动一个41万亿元的市场？
到2023年，Web3.0区块链技术领域的价值将超过6万亿美元。

元宇宙2022-09-01

明略科技CTO郝杰：会话式AI应该是“静悄悄”的辅助智能
AI 一定要落在实处，一定要追求它能落地成功。不要做飘在天上的“阳春白雪”

元宇宙2022-08-31

三年亏7亿，智能语音老将思必驰拟上市“补血”
业务的扩张带来2021年的期间费用率的暂时上升及亏损比率扩大，但未来业务的

元宇宙2022-08-31

唐诗、东北话、谐音梗……人工智能还有什么是不能翻译的吗？
数字化时代，全球经济、文化的壁垒正在被打破，而语言上的无障碍交流沟通，

元宇宙2022-08-31

新公链们的叙事
至于技术方面，它们的方案也并没有太大的颠覆性创新，依旧在以太坊创立的框

元宇宙2022-08-31

英伟达挖矿史：“把这一代最优秀的工程师聚在一起，然后研究挖比特币”
如果问各大科技公司，英伟达这家公司最让人羡慕的地方是什么，“不受周期限

元宇宙2022-08-31

头条资讯

元宇宙概念为何爆发，互联网技术枯竭

音乐对顾客心理的影响

县级加盟什么店挣钱？

加盟雪丰建材需要什么条件？

未来经济发展的趋势？

推荐资讯

win7系统应用程序提示0x00000010错误怎么解决方法

OPPO,Vivo,华为，小米，哪个手机和智能手表更胜一筹？

在小县城开一家什么店比较赚钱?

在县城，做什么项目能挣大钱？

未来价值投资在哪里，未来经济世界又有着怎样的联系？

最近更新

首次在智能手机上训练BERT和ResNet，能耗降35%

DeepFake捏脸真假难辨，汤姆·克鲁斯比本人还像本人！

靠AI技术诈骗2亿的大案！Deepfake让明星大V都防不胜防

新科技新基建人工智能：开启无限可能

中国人工智能软件市场指南