生成式对抗网络（GAN）在计算机视觉上的应用--怡心湖

目前GAN的最基本的应用就是生成以假乱真的图像。图像生成的任务主要分两种，第一种是生成某种类别的图像，第二种是根据用户的描述生成符合描述的图像。目前，第一种图像生成的任务已经取得了很好的效果，例如2016年发表的PPGN模型，在视觉效果上已经取得了行业顶尖的效果，其生成的火山图像整体上已经可以达到以假乱真的效果。而根据描述生成图像的任务，目前达到的效果还差强人意。这个任务的难点在于，生成器并不是学到了如何生成每个物体之后把它们组合起来，而是尝试一次到位生成整张图像，这与人类绘画的过程不一样。GAN根据文字生成单个物体的图像效果很不错，但在多物体的复杂图像上效果就差得多，有时候甚至难以分辨生成的图像内容。可见，在文字转换为图像这个领域，还有非常大的研究空间。

继续阅读：对抗生成视觉

此文由怡心湖编辑，若您觉得有益，欢迎分享转发！：首页 > 常识论 » 生成式对抗网络（GAN）在计算机视觉上的应用

相关推荐