Update notebook with custom adapter

pplantinga · pplantinga · commit 9455734f41c6 · 2024-09-30T11:15:40.000-04:00
diff --git a/docs/tutorials/nn/neural-network-adapters.ipynb b/docs/tutorials/nn/neural-network-adapters.ipynb
@@ -302,13 +302,175 @@
     "!python train.py train_lora.yaml --number_of_epochs=1 --batch_size=2 --test_scorer \"!ref <valid_scorer>\" --enable_add_reverb=False --enable_add_noise=False #To speed up"
    ]
   },
+  {
+   "cell_type": "markdown",
+   "id": "f960be7a-6edb-47c1-bd8d-c7c0d486c81d",
+   "metadata": {},
+   "source": [
+    "## Custom adapter\n",
+    "\n",
+    "We designed this so that you could replace the SpeechBrain adapter with a `peft` adapter:\n",
+    "\n",
+    "```diff\n",
+    "model: !new:speechbrain.nnet.adapters.AdaptedModel\n",
+    "    model_to_adapt: !ref <model_pretrained>\n",
+    "-   adapter_class: !name:speechbrain.nnet.adapters.LoRA\n",
+    "+   adapter_class: !name:peft.tuners.lora.layer.Linear\n",
+    "    adapter_kwargs:\n",
+    "-       rank: 16\n",
+    "+       r: 16\n",
+    "+       adapter_name: lora\n",
+    "```\n",
+    "\n",
+    "But this trains exactly the same thing as before, so no need for us to go through the whole thing. Perhaps more interesting is designing a custom adapter:"
+   ]
+  },
   {
    "cell_type": "code",
-   "execution_count": null,
-   "id": "f3ed4d04-c6db-4cb1-a086-d558564fe402",
+   "execution_count": 12,
+   "id": "f9682f70-489a-4a1d-b8c6-1c73d98a824d",
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Writing conv_lora.py\n"
+     ]
+    }
+   ],
+   "source": [
+    "%%file conv_lora.py\n",
+    "\n",
+    "import torch\n",
+    "\n",
+    "class Conv2dLoRA(torch.nn.Module):\n",
+    "    def __init__(self, target_module, kernel_size=3, stride=2, channels=16):\n",
+    "        super().__init__()\n",
+    "\n",
+    "        # Disable gradient for pretrained module\n",
+    "        self.pretrained_module = target_module\n",
+    "        for param in self.pretrained_module.parameters():\n",
+    "            param.requires_grad = False\n",
+    "        device = target_module.weight.device\n",
+    "\n",
+    "        self.adapter_down_conv = torch.nn.Conv2D(\n",
+    "            in_channels=1, out_channels=channels, padding=\"same\", stride=2, bias=False, device=device\n",
+    "        )\n",
+    "        self.adapter_up_scale = torch.nn.Upscale(scale_factor=2)\n",
+    "        self.adapter_up_conv = torch.nn.Conv2D(\n",
+    "            in_channels=channels, out_channels=1, padding=\"same\", bias=False, device=device\n",
+    "        )\n",
+    "\n",
+    "\n",
+    "    def forward(self, x: torch.Tensor):\n",
+    "        \"\"\"Applies the LoRA Adapter.\n",
+    "\n",
+    "        Arguments\n",
+    "        ---------\n",
+    "        x: torch.Tensor\n",
+    "            Input tensor to the adapter module.\n",
+    "\n",
+    "        Returns\n",
+    "        -------\n",
+    "        The linear outputs\n",
+    "        \"\"\"\n",
+    "        x_pretrained = self.pretrained_module(x)\n",
+    "        x_conv_lora = self.adapter_up_conv(self.adapter_up_scale(self.adapter_down_conv(x)))\n",
+    "\n",
+    "        return x_pretrained + x_conv_lora * self.scaling"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 13,
+   "id": "c2e702a9-c07d-4a76-94bc-847b8f890579",
    "metadata": {},
    "outputs": [],
-   "source": []
+   "source": [
+    "# Change the adapter out\n",
+    "train_yaml = train_yaml.replace(\"output_folder: !ref results/crdnn_lora/<seed>\", \"output_folder: !ref results/crdnn_conv_lora/<seed>\")\n",
+    "train_yaml.replace(\"\"\"\n",
+    "model: !new:speechbrain.nnet.adapters.AdaptedModel\n",
+    "    model_to_adapt: !ref <model_pretrained>\n",
+    "    adapter_class: !name:speechbrain.nnet.adapters.LoRA\n",
+    "    adapter_kwargs:\n",
+    "        rank: 16\n",
+    "\"\"\", \"\"\"\n",
+    "model: !new:speechbrain.nnet.adapters.AdaptedModel\n",
+    "    model_to_adapt: !ref <model_pretrained>\n",
+    "    adapter_class: !name:conv_lora.Conv2dLoRA\n",
+    "    adapter_kwargs:\n",
+    "        kernel_size: 3\n",
+    "        stride: 2\n",
+    "        channels: 16\n",
+    "\"\"\")\n",
+    "\n",
+    "with open(\"train_conv_lora.yaml\", \"w\") as f:\n",
+    "    f.write(train_yaml)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 14,
+   "id": "56aefd64-1325-4891-a9a4-1c4e85691b96",
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "WARNING:speechbrain.utils.train_logger:torchvision is not available - cannot save figures\n",
+      "/home/competerscience/Documents/Repositories/speechbrain/speechbrain/utils/autocast.py:68: FutureWarning: `torch.cuda.amp.custom_fwd(args...)` is deprecated. Please use `torch.amp.custom_fwd(args..., device_type='cuda')` instead.\n",
+      "  wrapped_fwd = torch.cuda.amp.custom_fwd(fwd, cast_inputs=cast_inputs)\n",
+      "speechbrain.core - Beginning experiment!\n",
+      "speechbrain.core - Experiment folder: results/crdnn_conv_lora/4324\n",
+      "mini_librispeech_prepare - Preparation completed in previous run, skipping.\n",
+      "../data/noise/data.zip exists. Skipping download\n",
+      "../data/rir/data.zip exists. Skipping download\n",
+      "speechbrain.utils.parameter_transfer - Loading pretrained files for: lm, tokenizer, model\n",
+      "/home/competerscience/Documents/Repositories/speechbrain/speechbrain/utils/checkpoints.py:199: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.\n",
+      "  state_dict = torch.load(path, map_location=device)\n",
+      "speechbrain.core - Exception:\n",
+      "Traceback (most recent call last):\n",
+      "  File \"/home/competerscience/Documents/Repositories/speechbrain/docs/tutorials/nn/speechbrain/templates/speech_recognition/ASR/train.py\", line 461, in <module>\n",
+      "    hparams[\"pretrainer\"].load_collected()\n",
+      "  File \"/home/competerscience/Documents/Repositories/speechbrain/speechbrain/utils/parameter_transfer.py\", line 295, in load_collected\n",
+      "    self._call_load_hooks(paramfiles)\n",
+      "  File \"/home/competerscience/Documents/Repositories/speechbrain/speechbrain/utils/parameter_transfer.py\", line 312, in _call_load_hooks\n",
+      "    default_hook(obj, loadpath)\n",
+      "  File \"/home/competerscience/Documents/Repositories/speechbrain/speechbrain/utils/checkpoints.py\", line 240, in torch_parameter_transfer\n",
+      "    state_dict = torch_patched_state_dict_load(path, device)\n",
+      "                 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^\n",
+      "  File \"/home/competerscience/Documents/Repositories/speechbrain/speechbrain/utils/checkpoints.py\", line 199, in torch_patched_state_dict_load\n",
+      "    state_dict = torch.load(path, map_location=device)\n",
+      "                 ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^\n",
+      "  File \"/home/competerscience/Documents/uvenv/lib/python3.12/site-packages/torch/serialization.py\", line 1065, in load\n",
+      "    with _open_file_like(f, 'rb') as opened_file:\n",
+      "         ^^^^^^^^^^^^^^^^^^^^^^^^\n",
+      "  File \"/home/competerscience/Documents/uvenv/lib/python3.12/site-packages/torch/serialization.py\", line 468, in _open_file_like\n",
+      "    return _open_file(name_or_buffer, mode)\n",
+      "           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^\n",
+      "  File \"/home/competerscience/Documents/uvenv/lib/python3.12/site-packages/torch/serialization.py\", line 449, in __init__\n",
+      "    super().__init__(open(name, mode))\n",
+      "                     ^^^^^^^^^^^^^^^^\n",
+      "FileNotFoundError: [Errno 2] No such file or directory: '/home/competerscience/Documents/Repositories/speechbrain/docs/tutorials/nn/speechbrain/templates/speech_recognition/ASR/results/CRDNN_BPE_960h_LM/2602/save/lm.ckpt'\n"
+     ]
+    }
+   ],
+   "source": [
+    "!python train.py train_conv_lora.yaml --number_of_epochs=1 --batch_size=2 --test_scorer \"!ref <valid_scorer>\" --enable_add_reverb=False --enable_add_noise=False #To speed up"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "id": "21ef247c-3022-4b65-8cd0-86d01a618b79",
+   "metadata": {},
+   "source": [
+    "## Conclusion\n",
+    "\n",
+    "That's it, thanks for following along! Go forth and make cool adapters."
+   ]
   }
  ],
  "metadata": {