加入收藏 | 设为首页 |

皮裤-DeepMind 发布 VQVAE-2,图片生成作用逾越 BigGAN

海外新闻 时间: 浏览:446 次

雷锋网 AI 科技谈论按,近来,DeepMind 的研讨人员宣告,VQVAE-2 面世了!

VQ-VAE 是 Vector Quantised-Variational Auto Encoder 的简写,此次的 VQ-VAE2 是 DeepMind 根据第一代 VQ-VAE 研讨出来的改善模型。相关的论文已被 ICLR2019 接纳为口头报告论文,DeepMind 研讨员 Suman Ravuri 做了精彩的现皮裤-DeepMind 发布 VQVAE-2,图片生成作用逾越 BigGAN场讲演。

论文 ARIXV 链接:http://arxiv.org/abs/1906.00446

论文摘要如下:

咱们探讨了矢量量化变分自动编码(VQ-VAE)模型在大规模图画生成中的运用。为此,咱们对VQ-VAE 中运用的自回归先验进行了缩放和增强,意图是生成比曾经具有更高相关度和保真度的组成样本。咱们运用简略的前馈编解码器网络,这让咱们的模型关于编码\解码速度至关重要的运用皮裤-DeepMind 发布 VQVAE-2,图片生成作用逾越 BigGAN十分有用。此外,VQ-VAE 只是只需要在紧缩潜在空间中对自回归模型进行采样,这比在像素空间中的采样在速度上快一个数量级,关于大型图画特别如此。咱皮裤-DeepMind 发布 VQVAE-2,图片生成作用逾越 BigGAN们证明了一个 VQ-VAE 的多标准层次安排,加上强壮的先验潜在代码,能够在多种数据集(如 ImageNet)上生成质量与最先进的生成对立网络相媲美的样本,一起不受 GAN 的已知缺陷,如形式溃散、多样性的缺少等的影响。

乾陵

DeepMindAI 的这一研讨标明,当用于练习分类器(数据增强)时,GAN 生成在看起来实在的样本的才能有限。初始分数与分类体现呈负相关。

论文的三位作者之一,DeepMind 的研讨人员 Aaron van den皮裤-DeepMind 发布 VQVAE-2,图片生成作用逾越 BigGAN Oord 在 twitter 上表明,这是一个在分层紧缩潜在空间中的强壮自回归模型,在创立示例时,任何形式中都没有遇到溃散问题。

更多示例和细节如下:

他们运用一个分层的 VQVAE,将图画紧缩成一个潜在空间,相关于 ImageNet皮裤-DeepMind 发布 VQVAE-2,图片生成作用逾越 BigGAN 来说,这个空皮裤-DeepMind 发布 VQVAE-2,图片生成作用逾越 BigGAN间要小 50 倍,相关于 FFHQ 面来说,这个空间要小 200 倍。PixelCNN 仅对最新的产品进行建模,使其能够将其才能用于大局结构和最显着的特征上。

他们 256 像素的两级 ImageNet VQVAE 中的样本如下:

成果,他们发现,这些样本在多样性方面比竞争对手的办法生成的样本要好得多。

关于百万像素的人脸(1024x1024),他们运用了三级 VQVAE 模型。

更多的样本和高分辨率未紧缩图画能够在这里找到:https://t.co/EGaUMHA7FN?amp=1

感兴趣的童鞋能够下载相关,开端愉快地学习吧~

雷锋网雷锋网

声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间服务。