Update Chapter 17

devonchenc · devonchenc · commit 9323f19e7b89 · 2021-09-26T00:19:51.000+08:00
diff --git a/17.Generative_adversarial_networks.ipynb b/17.Generative_adversarial_networks.ipynb
@@ -82,7 +82,7 @@
    "id": "a3885b9f",
    "metadata": {},
    "source": [
-    "- **生成器**$G$：它以一个随机向量（潜在空间中的一个随机点）作为输入，并将其解码为一张合成图像。\n",
+    "- **生成器**$G$：它以一个随机向量（隐空间中的一个随机点）作为输入，并将其解码为一张合成图像。\n",
     "\n",
     "\n",
     "- **判别器**$D$：以一张图像（真实的或合成的均可）作为输入，并预测该图像是来自训练集还是由生成器创建。"
@@ -98,46 +98,127 @@
   },
   {
    "cell_type": "markdown",
-   "id": "1cc5f2a3",
+   "id": "5eb07848",
    "metadata": {},
    "source": [
-    "基于这样的思想可以设计出 GAN 的目标函数如下式所示：\n",
+    "> 对于生成器 $G$ 来说，通过随机噪声 $z$ 作为输入，生成器 $G$ 期望自己生成的样本尽可能地欺骗判别器 $D$，所以需要最大化判别概率 $D(G(z))$。因此，生成器 $G$ 的目标函数可以定义为最小化 ${\\rm log}(1-D(G(z)))$。\n",
+    "\n",
+    "$$ {\\min_G} \\; \\mathbb{E}_{z\\sim p_ {z}\\;(z)}[{\\rm log}(1-D(G(z)))] $$\n",
     "\n",
-    "$$ {\\rm min} \\; {\\rm max}\\; V(D, G) = \\mathbb{E}_{x\\sim p_ {\\rm data}\\;(x)}[{\\rm log}D(x)] + \\mathbb{E}_{z\\sim p_ {\\rm z}\\;(z)}[{\\rm log}(1-D(G(z)))] $$"
+    "> 对于判别器 $D$，为了尽可能地区分真实样本和虚假的生成样本，它希望最小化判别概率 $D(G(z))$ 的同时，最大化判别概率 $D(x)$。因此，判别器 $D$ 的目标函数可以定义为最大化 $ {\\rm log} D(x) + {\\rm log}(1-D(G(z)))$。\n",
+    " \n",
+    "$$ {\\max_D}\\;\\mathbb{E}_{x\\sim p_ {\\rm data}\\;(x)}[{\\rm log}D(x)] + \\mathbb{E}_{z\\sim p_ {z}\\;(z)}[{\\rm log}(1-D(G(z)))] $$"
    ]
   },
   {
    "cell_type": "markdown",
    "id": "463fff5b",
    "metadata": {},
    "source": [
-    "其中 $G$ 代表生成器，$D$ 代表判别器，$P_{\\rm data}(x)$ 代表真实样本的概率分布，$P_{z}(z)$ 代表随机噪声的概率分布，$z$ 是服从高斯分布的随机噪声。"
+    "其中 $P_{\\rm data}(x)$ 代表真实样本的概率分布，$P_{z}(z)$ 代表随机噪声的概率分布，$z$ 是服从高斯分布的随机噪声。"
    ]
   },
   {
    "cell_type": "markdown",
-   "id": "5eb07848",
+   "id": "1cc5f2a3",
    "metadata": {},
    "source": [
-    "> 对于生成器 $G$ 来说，通过随机噪声 $z$ 作为输入，生成器 $G$ 期望自己生成的样本尽可能地欺骗判别器 $D$，所以需要最大化判别概率 $D(G(z))$，于是对于生成器 $G$，它的目标函数是最小化 ${\\rm log}(1-D(G(z)))$。\n",
+    "基于以上思想可以设计出 GAN 的总目标函数如下式所示：\n",
     "\n",
-    "> 对于判别器 $D$，为了尽可能地区分真实样本和虚假的生成样本，它希望最小化判别概率 $D(G(z))$ 的同时，最大化判别概率 $D(x)$。于是判别器的目标函数是最大化 $ {\\rm log} D(x) + {\\rm log}(1-D(G(z)))$。"
+    "$$ {\\min_G} \\; {\\max_D}\\; V(D, G) = \\mathbb{E}_{x\\sim p_ {\\rm data}\\;(x)}[{\\rm log}D(x)] + \\mathbb{E}_{z\\sim p_ {\\rm z}\\;(z)}[{\\rm log}(1-D(G(z)))] $$"
    ]
   },
   {
    "cell_type": "markdown",
    "id": "94a926a4",
    "metadata": {},
-   "source": []
+   "source": [
+    "对抗训练过程由两个神经网络交替进行：\n",
+    "\n",
+    "- 先训练 $D$：选取一批真实样本和一批隐变量，隐变量通过 $G$ 得到生成样本，保持 $G$ 权值不变，利用随机梯度上升法计算并更新 $D$ 网络的权值；\n",
+    "\n",
+    "\n",
+    "- 随后训练 $G$：选取一批隐变量通过 $G$ 得到生成样本，保持 $D$ 权值不变，利用随机梯度下降法计算并更新 $G$ 网络的权值。"
+   ]
   },
   {
    "cell_type": "markdown",
    "id": "21c95b3b",
    "metadata": {},
    "source": [
-    "在对抗训练的过程中，判别器$D$ 判别真假样本的能力逐渐提高；而 生成器$G$ 为了欺骗判别器$D$，生成样本逐渐趋近于真实样本，最终使整个模型生成质量较好的新数据。"
+    "在对抗训练的过程中，判别器 $D$ 判别真假样本的能力逐渐提高；而生成器 $G$ 为了欺骗判别器 $D$，生成样本逐渐趋近于真实样本，最终使整个模型生成质量较好的新数据。"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "ab49f57e",
+   "metadata": {},
+   "source": [
+    "## 2.2 GAN全局最优解"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "6ef903ca",
+   "metadata": {},
+   "source": [
+    "此前将 $p_{\\rm data}$ 定义为真实样本的概率分布，我们将 $p_g$ 定义为 $G(z)$ 生成样本的概率分布。"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "19f26885",
+   "metadata": {},
+   "source": [
+    "此处补充论文公式3"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "8cdd7e3e",
+   "metadata": {},
+   "source": []
+  },
+  {
+   "cell_type": "markdown",
+   "id": "305915f7",
+   "metadata": {},
+   "source": []
+  },
+  {
+   "cell_type": "markdown",
+   "id": "8d261b52",
+   "metadata": {},
+   "source": [
+    "GAN全局最优解为："
    ]
   },
+  {
+   "cell_type": "markdown",
+   "id": "8fc6c5fb",
+   "metadata": {},
+   "source": [
+    "$$p_g = p_{\\rm data}$$"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "f3cd12d5",
+   "metadata": {},
+   "source": []
+  },
+  {
+   "cell_type": "markdown",
+   "id": "8e86cf4a",
+   "metadata": {},
+   "source": []
+  },
+  {
+   "cell_type": "markdown",
+   "id": "9360a354",
+   "metadata": {},
+   "source": []
+  },
   {
    "cell_type": "markdown",
    "id": "51f2530d",
@@ -149,7 +230,7 @@
    "id": "ad06db0f",
    "metadata": {},
    "source": [
-    "## 2.2 GAN的缺点"
+    "## 2.3 GAN的缺点"
    ]
   },
   {