【Hackathon 8th No.23】Improved Training of Wasserstein GANs 论文复现 -part by XvLingWYY · Pull Request #1146 · PaddlePaddle/PaddleScience (original) (raw)
当向不了解生成对抗网络(GAN)的人解释为什么在每个batch size中真实图片和生成的图片并不一样,不能使用均方误差(MSE)损失评估时,可以这样来解释:
想象你正在教一个孩子画画。这个孩子刚开始学习如何画猫。每次你给他看一张真实的猫的照片,并让他尝试画出这张照片中的猫。但这里有个问题:孩子每次画出来的猫都不一样,而且与任何他之前看到的真实猫的照片也不完全相同。
如果我们用一种非常简单的方式来评价孩子的作品,比如说“看看你的画和这张照片里的猫有多接近”,我们实际上是在测量两幅图像之间的像素差异——这就像MSE损失所做的。但是,在这种情况下,这种方法并不是很有帮助,因为目标不是让孩子精确地复制每一张照片,而是要让他们能够画出看起来像猫的图像,即使这些图像没有一张与特定的照片一模一样。
在GANs中,生成器的任务是创建看起来逼真的图像,而不是精确复制训练集中的图像。因此,使用MSE这样的度量标准来比较生成的图像和真实图像并不合适,因为它会惩罚那些虽然看起来很真实但与具体某张训练图像不同的生成结果。相反,GANs使用了一种更智能的方法,即通过判别器网络来判断一张图像是来自真实数据分布还是由生成器创造的,从而引导生成器产生更加逼真的图像。
总结来说,关键点在于GAN的目标是让生成的图像具有足够的真实感,而不是让它们与某个特定的真实图像尽可能相似。这就需要采用不同于MSE的评价方法,比如对抗性损失,来指导模型的学习过程。