给我1张图，生成30秒视频！｜DeepMind新作(2)

2022-09-15 13:40来源：未知编辑：admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

（b）多帧U-Net block由NF-Net卷积块、多帧自注意力块组成，它们在输入帧之间交换信息和 Transformer式的残差MLP。

再来看看处理图像输入的Multi-Frame U-Net。 U-Net的输入是由N个DCT帧和部分隐藏目标DCT帧组成的序列，注释信息以与每个输入帧相关联的向量的形式提供。 U-Net的核心组件是一个计算块，它首先将一个共享的NF-ResNet 卷积块应用于每个输入帧，然后应用一个Transformer样式的自我注意块来聚合跨帧的信息。（图2 b） NF-ResNet块由分组卷积和挤压和激发层组成，旨在提高TPU的性能。下面，图(a)比较了RoboNet (128x128) 和KITTI视频的绝对和残差DCT表征的稀疏性。由于RoboNet由只有少数运动元素的静态视频组成，因此残差帧表征的稀疏性显著增加。而KITTI视频通常具有移动摄像头，导致连续帧中几乎所有地方都存在差异。但在这种情况下，稀疏性小带来的好处也随之弱化。

多视觉任务强者

通过一系列数据集和任务的测试，结果显示Transframer可以应用在多个广泛任务上。
其中就包括视频建模、新视图合成、语义分割、对象识别、深度估计、光流预测等等。视频建模通过Transframer在给定一系列输入视频帧的情况下预测下一帧。研究人员分别在KITTI和RoboNet两个数据集上，训练了Transframer在视频生成上的性能如何。对于KITTI，给定5个上下文帧和25采样帧，结果显示，Transframer模型在所有指标上的性能都有所提高，其中LPIPS和FVD的改进是最显而易见的。在RoboNet上，研究人员给定2个上下文帧和10个采样帧，分别以64x64 和 128x128 的分辨率进行训练，最终也取得了非常好的结果。视图合成在视图合成方面，研究者通过提供相机视图作为表 1（第 3 行）中描述的上下文和目标注释，以及统一采样多个上下文视图，直到指定的最大值。通过提供1-2个上下文视图，在ShapeNet 基准上评估模型Transframer，明显优于PixelNeRF和SRN。此外在数据集Objectron进行评估后，可以看出当给定单个输入视图时，模型会产生连贯的输出，但会遗漏一些特征，比如交叉的椅子腿。当给出1个上下文视图，以128×128分辨率合成的视图如下：当再给出2个上下文视图，以128×128分辨率合成的视图如下：多视觉任务不同的计算机视觉任务通常使用复杂的架构和损失函数来处理。这里，研究人员在8个不同的任务和数据集上使用相同的损失函数联合训练了Transframer模型。这8个任务分别是：单个图像的光流预测、对象分类、检测和分割、语义分割（在2个数据集上）、未来帧预测和深度估计。结果显示，Transframer学会在完全不同的任务中生成不同的样本，在某些任务中，比如 Cityscapes，该模型产生了质量上好的输出。但是，在未来帧预测和边界框检测等任务上的模型输出质量参差不齐，这表明在此设置中建模更具挑战性。

99科技网：http://www.99it.com.cn

共3页:
上一页
1
2
3
下一页

相关推荐

谷歌用新AI超越自己：让Imagen能够指定生成对象，风格还能随意转换
给Imagen加上“指哪打哪”的能力，会变得有多强？

快资讯2022-09-15

Kura Tech用AI生成世界最高性能的AR光学
2022年获得CES创新奖的一流增强现实 (AR) 智能眼镜和平台开发商Kura Technologies今天

快资讯2022-08-29

给我1张图，生成30秒视频！｜DeepMind新作
近日，DeepMind提出了一种基于概率帧预测的图像建模和视觉任务的通用框架——

快资讯2022-08-24

AI帮视障人士无障碍阅读，可实时生成海量数字盲文
盲文AI实时翻译算法是本软件的核心技术之一，可以实时生成海量盲文数字资源

快资讯2022-07-24

如何在Excel电子表格中生成随机数
Excel如何生成随机数 1、创建新的空Excel表单，然后单击、 2、先选小区 3、输入

快资讯2022-07-20

畅想未来出行，高度AI智能化的汽车会给我们的出行带来怎样的改变？
高度AI智能化的汽车会给我们带来数不清的美妙。尤其是懒得学开车的朋友，这

快资讯2022-07-20

2022 卡塔尔世界杯用上新的“黑科技”：足球内嵌传感器，12 个摄像头追踪越位，还能生成 3D 动画
IT之家 7 月 2 日消息，国际足联今日发文称，2022 年卡塔尔世界杯将采用新的半

快资讯2022-07-02

雷军领导小米给我们生活带来的改变是改变传统行业病态的存在
原标题：雷军领导小米给我们生活带来的改变是改变传统行业病态的存在小米

快资讯2019-11-18

顺丰速运法人发生更变，新法人是谁，又会给我们带来什么影响呢？
原标题：顺丰速运法人发生更变，新法人是谁，又会给我们带来什么影响呢？

快资讯2019-03-04

2018微信数据报告在这里查看生成你的专属报告！
原标题：2018微信数据报告在这里查看生成你的专属报告！支付宝交出了年度账

快资讯2019-01-10

头条资讯

元宇宙概念为何爆发，互联网技术枯竭

音乐对顾客心理的影响

县级加盟什么店挣钱？

加盟雪丰建材需要什么条件？

未来经济发展的趋势？

推荐资讯

win7系统应用程序提示0x00000010错误怎么解决方法

OPPO,Vivo,华为，小米，哪个手机和智能手表更胜一筹？

在小县城开一家什么店比较赚钱?

在县城，做什么项目能挣大钱？

未来价值投资在哪里，未来经济世界又有着怎样的联系？

最近更新

买「数字藏品」的年轻人：有人赚10万，有人被套牢

别骗人了由nft推动的游戏哪里来的互操作性?

大厂排兵布阵NFT详情

阿波罗最新兑付消息：2022回款打算敲定，全额清退不是问题（兑付慎重受骗）

长投学堂最新兑付消息：2022年平台曝光兑付细节,让你全程无忧（协会动态）