# HANDOFF — L23203v2 第三波重生（5 張）

> 日期：2026-05-07（午後）
> 派工人：Heiter
> 目標：依欣梅爾午後 review 修 L23203v2 的 P11a / P12b / P12c / P13a / P13b 共 5 張
> 圖檔規格：16:9 / 2048x1152 / 繁體中文清楚可讀
> 風格：手寫講義筆記（淡米白方格紙、黑色粗手寫標題、青綠底線、暖黃重點框、紅橘標註、多色手繪圓圈編號）

## 鎖死規則（每張都適用）

1. **絕對不要刪除或覆蓋任何既有 PNG**。新檔放到 `L23203_深度學習原理與框架v2/images/` 即可，原圖（含 v1 / v2）完全保留。
2. **檔名一字不差**按本檔規定。**v2 已存在所以本批新檔用 v3**。
3. **三個共通負向約束**（每張 prompt 開頭都附）：
   - 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」
   - 嚴禁出現任何過頁鉤子文字（「見 P10a」「見 P10b」「← 上一頁」「→ 下一頁」「見 §3.(2)」等任何指向其他頁面的字樣）
   - 嚴禁出現右上角頁碼

## 共用變數

```
L_CODE = "L23203"

STYLE_BASE = "請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。"

LAYOUT_RULE = "版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。避免密密麻麻小字；公式若出現，請以手寫公式框呈現並保持符號正確。"
```

---

# ① P11a 重生 — RNN 結構與運作（重組為「關鍵特性三區塊」+ 強調「記憶」）

**舊檔保留**：`L23203_p11a_sec3_3_rnn_structure.png`（v1）+ `L23203_p11a_sec3_3_rnn_structure_v2.png`
**新檔名**：`L23203_p11a_sec3_3_rnn_structure_v3.png`

**動因**：依教材原文行 618「**關鍵特性**」段，原本就分三項：權重共享 / 「展開」視角 / 反向傳播。v2 圖把這三項弱化為主視覺的旁註，沒有獨立成「關鍵特性」三區塊。另教材「記憶」概念出現 5 次（行 586/588/604/658/692），是 RNN 核心，視覺需特殊強調。

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字（「見 P11b」「→ 衍伸模型」「LSTM/GRU/Bi-RNN/Deep RNN 見」全部刪除）。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

教材原詞必須清楚出現：遞迴神經網路（Recurrent Neural Network, RNN）、可變長度序列輸入數據（Sequential Data）、前饋神經網路、MLP、CNN、內部「記憶」機制、時間依賴性、上下文資訊、循環連接（Recurrent Connections）、時間步、輸入（Xt）、隱藏狀態（Ht）、上一個時間步的隱藏狀態（Ht-1）、Tanh、ReLU、輸出（Ot）、關鍵特性、權重共享（Weight Sharing）、任意長度的序列、「展開」視角（Unrolled View）、深度前饋網路、反向傳播、時間上的反向傳播（Backpropagation Through Time, BPTT）、鏈式法則、梯度消失（Vanishing Gradient Problem）、梯度爆炸（Exploding Gradient Problem）、長期依賴問題、訓練速度慢、串行、平行計算。

【TERMS_RULE 覆寫 — v3 修復】
不要改寫為其他英文術語，不要省略教材括號中的英文詞。
- 版面頂部必須留出主標題列「3.（3）遞迴神經網路（Recurrent Neural Network, RNN）」與左上 L-code「L23203」。
- 版面中段必須有獨立大區塊「關鍵特性」，下分三個並排子區塊（教材原文行 618 起）：① 權重共享 ② 「展開」視角 ③ 反向傳播。每個子區塊必須有教材原文的核心句說明（見下方版面規範）。
- 「記憶」概念必須在頁面上以特殊色（紅橘或暖黃重點框）強調至少 3 處：
  · 頁首導論「內部『記憶』機制」用紅橘星號標出
  · 主視覺隱藏狀態 Ht 用暖黃色塊框 + 紅橘小字標「← RNN 的『記憶』所在」
  · 缺點區塊「梯度消失」副敘加紅橘小字「= 『記憶』太短」（教材原文）
- 嚴禁出現「Sequence to Sequence (Seq2Seq)」（教材未提）。
- 嚴禁出現任何過頁鉤子文字 — 頁尾「→ 衍伸模型 LSTM/GRU/Bi-RNN/Deep RNN 見 P11b」整段刪除。

左上角標示「L23203」。主標題寫「3.（3）遞迴神經網路（Recurrent Neural Network, RNN）」，副標寫「① 結構與運作 + BPTT 訓練」。

【頁首導論橫幅】（細條，占上方約 10%）
相較於 MLP/CNN 的前饋結構，RNN 引入循環連接（Recurrent Connections）建立內部「記憶」機制（★ 用紅橘星號標出「記憶」二字），能處理可變長度序列輸入數據（Sequential Data）並捕捉時間依賴性與上下文資訊。

【主視覺 — 占頁面上半 30%】
畫 RNN 基本單元（折疊形式）：
- 時間步 t 接收當前輸入 Xt + 上一個時間步隱藏狀態 Ht-1
- 透過權重加權求和 + 非線性激活函數（Tanh/ReLU）
- 產生新隱藏狀態 Ht（用暖黃色塊重點框，旁邊加紅橘小字「← RNN 的『記憶』所在」）
- 產生輸出 Ot
- 中央畫一個明顯的「自我循環」箭頭強調 Recurrent Connection

【關鍵特性 — 占頁面中段 40%，三大區塊橫排】
標題用粗手寫體寫「關鍵特性」（教材原文行 618），下分三個並排子卡：

① 權重共享（Weight Sharing）
- 跨時間步重複共享同一套權重參數
- 學習序列中通用模式 + 處理任意長度序列
- 視覺：5 個時間步的 RNN 單元連接成串，所有單元用同色標註權重相同

② 「展開」視角（Unrolled View）
- 折疊形式的迴圈 → 想像為時間維度上「展開」的深度前饋網路
- 每個時間步 = 一個「層」，每層共享相同權重
- 視覺：左邊畫折疊形式（一個帶迴圈的單元）↔ 右邊畫展開形式（4-5 個時間步串成的深度網路）

③ 反向傳播（時間上的反向傳播 BPTT）
- 將整個序列在時間維度上展開 → 形成沒有循環的深層網路
- 利用鏈式法則（Chain Rule）沿時間軸反向傳播梯度
- 視覺：箭頭從最後時間步反向回傳，紅橘色標出梯度流動方向

【缺點與限制 — 占頁面下半 20%】
四個小卡橫排（保留現有）：
① 梯度消失（Vanishing Gradient Problem）— 紅橘小字加「即『記憶』太短」（教材原文）
② 梯度爆炸（Exploding Gradient Problem）
③ 訓練速度慢（串行難平行計算）
④ 難以捕捉超長距離依賴

【絕對不要畫】
- 頁尾任何過頁鉤子文字（「→ 衍伸模型 LSTM/GRU/Bi-RNN/Deep RNN 見 P11b」全部刪除）

版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。
```

建議輸出檔名：`L23203_p11a_sec3_3_rnn_structure_v3.png`

---

# ② P12b 重生 — Transformer 從五大組成改成「六大組成」

**舊檔保留**：`L23203_p12b_sec3_4_transformer_components.png`（v1）+ `L23203_p12b_sec3_4_transformer_components_v2.png`
**新檔名**：`L23203_p12b_sec3_4_transformer_components_v3.png`

**動因**：教材行 792–867「**模型組成機制**」共 6 個 bullet，v2 prompt 寫成 5 個漏掉「前饋網路（Feed-Forward Network, FFN）」這一獨立區塊（教材行 845–849）— A 類 prompt 漏寫教材原詞。

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

教材原詞必須清楚出現：注意力機制（Attention Mechanism）、自注意力（Self-Attention）、查詢向量（Query, Q）、鍵向量（Key, K）、值向量（Value, V）、線性變換、多頭注意力機制（Multi-Head Attention）、表示子空間、拼接與線性轉換、位置編碼（Positional Encoding）、詞嵌入（Word Embeddings）、正弦和餘弦函數、前饋網路（Feed-Forward Network, FFN）、兩個線性層、全連接網路、ReLU、殘差連接（Residual Connections）、跳躍連接、層歸一化（Layer Normalization, LN）、批次歸一化（Batch Normalization）、內部協變偏移（Internal Covariate Shift, ICS）、上下文向量、加權求和。

【TERMS_RULE 覆寫 — v3 修復】
不要改寫為其他英文術語，不要省略教材括號中的英文詞。
- 副標必須寫「② 六大組成模組」（教材原文行 792 起共有 6 個獨立 bullet — 注意力機制 / 自注意力 / 多頭注意力 / 位置編碼 / 前饋網路 / 殘差連接+層歸一化）。嚴禁寫成「五大組成模組」或省略其中任一項。
- 必須有獨立的「⑤ 前饋網路（Feed-Forward Network, FFN）」小卡（v2 P12b 漏寫此項為 A 類遺漏，本次必補）。
- 位置編碼必須拼為「Positional Encoding」（嚴禁誤拼成 Postional Encoding）。
- 位置編碼處用文字描述「正弦和餘弦函數（sinusoidal / cosine functions）」即可，不要寫具體公式。
- Q/K/V 向量必須以「查詢向量（Query, Q）」「鍵向量（Key, K）」「值向量（Value, V）」教材原文形式呈現。
- 嚴禁出現任何過頁鉤子文字 — 頁尾「← 雙塔架構見 P12a；→ 衍伸模型 BERT/GPT/T5/ViT/長序列 見 P12c」整段刪除。

左上角標示「L23203」。主標題寫「3.（4）Transformer 架構」，副標寫「② 六大組成模組」。

【頁首導論橫幅】（細條）
Transformer 不靠循環結構，而是由六大可疊加模組組合而成；以下依教材順序逐一介紹。

【主視覺 — 占頁面中央】
六個模組小卡並列（建議排版：3 列 x 2 欄 或 2 列 x 3 欄），每張卡用不同手繪色塊區分：

① 注意力機制（Attention Mechanism）
核心思想：動態關注序列中任意元素，計算當前元素與其他元素的相似度並分配注意力權重
產出：加權求和上下文向量
目的：解決 RNN 長期依賴問題

② 自注意力（Self-Attention）
Q/K/V 三向量公式：
- 查詢向量（Query, Q）= 「我在找什麼？」
- 鍵向量（Key, K）= 「我能提供什麼？」
- 值向量（Value, V）= 「被關注時提供什麼？」
特點：直接建立序列中任意兩元素關係，無視距離

③ 多頭注意力機制（Multi-Head Attention）
拆分 → 並行 h 個頭（不同表示子空間）→ 拼接與線性轉換
特點：捕捉多樣關係 + 增強表示能力

④ 位置編碼（Positional Encoding）
為解決自注意力本身無序，注入正弦和餘弦函數（sinusoidal / cosine functions）形式的位置資訊到詞嵌入（Word Embeddings）；只用文字描述，不寫具體 sin/cos 公式。

⑤ 前饋網路（Feed-Forward Network, FFN）← 本次新增
兩個線性層構成的全連接網路（中間含 ReLU 激活函數）
對序列中每個位置的輸出獨立且相同地應用，進一步轉換和處理注意力層所提取的資訊

⑥ 殘差連接（Residual Connections，跳躍連接）+ 層歸一化（Layer Normalization, LN）
殘差連接：Output = Input + Sublayer(Input)，緩解梯度消失，加速收斂，允許構建極深層次
層歸一化：相較於批次歸一化（Batch Normalization）不依賴批次大小，特別適合 NLP，能穩定訓練、減少內部協變偏移（Internal Covariate Shift, ICS）

【版面下方箭頭】
六大模組組合 → Encoder 層或 Decoder 層的內部結構

【絕對不要畫】
- 頁尾任何過頁鉤子文字

版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。
```

建議輸出檔名：`L23203_p12b_sec3_4_transformer_components_v3.png`

---

# ③ P12c 重生 — 優點補教材原文 + 新增適用情境（硬塞單頁）

**舊檔保留**：`L23203_p12c_sec3_4_transformer_variants.png`（v1）+ `L23203_p12c_sec3_4_transformer_variants_v2.png`
**新檔名**：`L23203_p12c_sec3_4_transformer_variants_v3.png`

**動因**：v2 圖優點只列標題（如「表示學習能力強」）難理解，需要補教材原文（如「能夠學習到非常豐富和語意化的特徵表示」）；缺點區已有「(需大量資料訓練)」等補充參考；教材有獨立「適用情境」段（行 905–919）3 大類，v2 漏寫；本批硬塞單頁不拆頁。

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

教材原詞必須清楚出現：捕捉長距離依賴、自注意力機制、長期依賴問題、高度並行化、序列中每個位置同時計算、訓練效率、良好的表示學習能力、能夠學習到非常豐富和語意化的特徵表示、遷移學習和預訓練模型、BERT、GPT、O（L²）、計算複雜度、隨序列長度平方成長、記憶體消耗、注意力權重矩陣、數據飢渴、需大量資料訓練、缺乏內建序列歸納偏置、位置編碼、適用情境、自然語言處理（NLP）、機器翻譯、文本生成、文本摘要、問答系統、情感分析、文本分類、電腦視覺、圖像分類、物體檢測、圖像分割、語音處理、語音辨識、語音合成、BERT（Bidirectional Encoder Representations from Transformers）、Masked Language Model、Next Sentence Prediction、GPT-2、GPT-3、GPT-4、GPT-5、零樣本（Zero-shot）、少樣本（Few-shot）、T5（Text-to-Text Transfer Transformer）、Vision Transformer（ViT）、Patches、長序列 Transformer、Longformer、Reformer、Performer、稀疏注意力（Sparse Attention）、局部注意力（Local Attention）、tokens。

【TERMS_RULE 覆寫 — v3 修復】
不要改寫為其他英文術語，不要省略教材括號中的英文詞。
- 優點 4 項每項必須帶教材原文補充說明（不可只列標題）：
  ① 捕捉長距離依賴（直接建立序列中任意兩位置關係，解決 RNN 長期依賴問題）
  ② 高度並行化（序列中每個位置同時計算，提高訓練效率）
  ③ 良好的表示學習能力（能夠學習到非常豐富和語意化的特徵表示）← 教材原文行 881
  ④ 遷移學習和預訓練模型（成為 BERT、GPT 系列等大型預訓練模型的基石）
- 必須新增「適用情境」獨立區塊（v2 漏寫，本次必補），列教材原文 3 大類：
  · 自然語言處理（NLP）：機器翻譯 / 文本生成 / 文本摘要 / 問答系統 / 情感分析 / 文本分類
  · 電腦視覺：圖像分類 / 物體檢測 / 圖像分割
  · 語音處理：語音辨識 / 語音合成
- 衍伸模型 BERT / GPT / T5 / ViT / Longformer / Reformer / Performer 名稱必須完整保留；GPT 系列必須完整列出 GPT-2 / GPT-3 / GPT-4 / GPT-5。
- 嚴禁出現任何過頁鉤子文字。
- 【密度約束】本頁需塞 4 區塊（優點 / 缺點 / 適用情境 / 衍伸模型族譜），但**字體不可被擠到不可讀**。適用情境用最精簡 icon + 詞列法（不寫詳細句子）。衍伸模型族譜可縮小但 5 個模型卡片必須全保留。如果空間真的不夠，衍伸族譜可改成單欄精簡橫排，每個模型 1-2 行。

左上角標示「L23203」。主標題寫「3.（4）Transformer 架構」，副標寫「③ 衍伸模型族譜 + 優缺點 + 適用情境」。

【上半 — 優點 + 缺點 + 適用情境，三欄並列佔約 50%】

左欄【優點 — 4 項各帶教材原文補充】
① 捕捉長距離依賴（直接建立任意兩位置關係，解決 RNN 長期依賴）
② 高度並行化（每個位置同時計算，提高訓練效率）
③ 良好的表示學習能力（能學習到豐富和語意化的特徵表示）
④ 遷移學習和預訓練模型（成為 BERT、GPT 等大型預訓練模型基石）

中欄【缺點 — 4 項保留現補充風格】
① O(L²) 計算複雜度（隨序列長度平方成長）
② 記憶體消耗大（需儲存注意力權重矩陣）
③ 數據飢渴（需大量資料訓練，否則容易過擬合）
④ 缺乏內建序列歸納偏置（需位置編碼補上順序資訊）

右欄【適用情境 — 3 大類用 icon + 詞列法】
🔤 自然語言處理（NLP）
   - 機器翻譯 / 文本生成 / 文本摘要
   - 問答系統 / 情感分析 / 文本分類
👁️ 電腦視覺
   - 圖像分類 / 物體檢測 / 圖像分割
🎙️ 語音處理
   - 語音辨識 / 語音合成

【下半 — 衍伸模型族譜 — 占約 50%，五個小卡橫排或精簡 2x3 排版】
1. BERT（Bidirectional Encoder Representations from Transformers）— 雙向編碼器；預訓練 = Masked Language Model（MLM）+ Next Sentence Prediction（NSP）；強於語言理解
2. GPT 系列（Generative Pre-trained Transformer）— 解碼器自迴歸生成；GPT-2 / GPT-3 / GPT-4 / GPT-5；零樣本（Zero-shot）/ 少樣本（Few-shot）能力
3. T5（Text-to-Text Transfer Transformer）— 把所有 NLP 任務統一為「文字進、文字出」格式
4. Vision Transformer（ViT）— 將圖像切成 Patches 視為「詞語」進電腦視覺領域
5. 長序列 Transformer — Longformer / Reformer / Performer，使用稀疏注意力（Sparse Attention）/ 局部注意力（Local Attention）處理超長 tokens 序列

【絕對不要畫】
- 頁尾任何過頁鉤子文字
- 字體被擠到不可讀的程度（寧可精簡內容也不可讓讀者看不清）

版面要有明確主視覺、清楚的區塊分界、少量關鍵詞與箭頭關係。
```

建議輸出檔名：`L23203_p12c_sec3_4_transformer_variants_v3.png`

---

# ④ P13a 重生 — 主標題位置調整 + 缺點補說明 + 新增適用情境

**舊檔保留**：`L23203_p13a_sec3_5_autoencoder.png`（v1）+ `L23203_p13a_sec3_5_autoencoder_v2.png`
**新檔名**：`L23203_p13a_sec3_5_autoencoder_v3.png`

**動因**：教材結構（行 956–1030）是「生成式模型核心目標 → 自編碼器標題 → 模型結構 → 訓練目標 → 優點 → 缺點 → 適用情境」。v2 圖把生成式模型核心目標當頁首橫幅但讓自編碼器標題沒被視為主標；缺點「潛在空間缺乏結構」教材有原文補充（行 1006-1008）但 v2 沒寫；教材有獨立「適用情境」段（行 1014-1030）但 v2 漏。

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字（「→ 對抗生成 GAN」「見 P13b」「② 生成對抗網路 GAN」這類過頁字樣全部刪除）。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

教材原詞必須清楚出現：生成式模型、學習訓練數據的底層分佈（Underlying Distribution）、生成新的、與訓練數據相似但卻是前所未見的數據、自編碼器（Autoencoder）、編碼器（Encoder）、解碼器（Decoder）、潛在空間向量、瓶頸層（Bottleneck Layer）、重構誤差（Reconstruction Error）、均方誤差（MSE）、二元交叉熵、降維、特徵學習、數據去噪、去噪自編碼器、異常偵測、重構而非生成「新」數據、潛在空間缺乏連續性或結構、採樣不能保證生成有意義的數據、生成數據品質可能有限、適用情境、降維與數據壓縮、無監督預訓練步驟、辨識與訓練數據分佈不符的離群值。

【TERMS_RULE 覆寫 — v3 修復】
不要改寫為其他英文術語，不要省略教材括號中的英文詞。
- 版面結構必須照教材原文（行 956–1030）順序：
  · 頁首先放「生成式模型核心目標」共用節導論橫幅（占約 12%）
  · 然後才是本頁主標「① 自編碼器（Autoencoder）」（教材標題位置）
  · 接著主視覺（沙漏型流程）+ 訓練目標
  · 然後優點 + 缺點兩格
  · 最後新增「適用情境」獨立區塊
- 缺點區「潛在空間缺乏結構」必須加教材原文補充說明：「缺乏連續性或結構，採樣不能保證生成有意義的數據」（教材原文行 1006-1008，v2 漏寫此補充說明，本次必補）。
- 必須新增「適用情境」獨立區塊（v2 漏寫，本次必補），列教材原文 4 項：
  · 降維與數據壓縮 — 為高維數據找到更緊湊的表示
  · 特徵學習 — 作為無監督預訓練步驟，提供更好的特徵
  · 數據去噪 — 濾除數據中的噪聲
  · 異常偵測 — 辨識與訓練數據分佈不符的離群值
- 重構誤差用文字描述「常用均方誤差（MSE）連續資料 / 二元交叉熵 二元資料」即可，不要寫具體數學公式（v1/v2 已修，本次延續）。
- 嚴禁出現任何過頁鉤子文字 — 不可寫「→ 對抗生成 GAN 見 P13b」也不可在頁首橫幅寫「② GAN（P13b）」這類字樣。共用節導論橫幅內若提及兩種模型，只能寫「兩種代表性生成式模型：① 自編碼器（重構導向）+ ② 生成對抗網路 GAN（對抗生成）」這種純列舉句，不寫頁碼。

左上角標示「L23203」。

【頁首生成式模型核心目標橫幅】（占上方約 12%，作為共用節導論）
標題：3.（5）生成式模型
內文：學習訓練數據的底層分佈（Underlying Distribution），不只做預測，更能生成新的、與訓練數據相似但卻是前所未見的數據。
副註：兩種代表性生成式模型 ① 自編碼器（重構導向）+ ② 生成對抗網路 GAN（對抗生成）

【主標題】（橫幅下方獨立行）
寫「① 自編碼器（Autoencoder）」— 配一個小手繪 icon（如沙漏或鏡子）

【主視覺 — 沙漏型流程，占頁面上半 30%】
畫一條由左至右的「沙漏型」流程：
高維輸入 → 編碼器（Encoder）→ 潛在空間向量 / 瓶頸層（Bottleneck Layer）（畫成中央最窄處）→ 解碼器（Decoder）→ 重構輸出
訓練目標：最小化重構誤差（Reconstruction Error）— 用文字描述「常用均方誤差（MSE）連續資料 / 二元交叉熵 二元資料」

【優點 + 缺點 — 中段兩格，占約 30%】
左格 優點 4 項：
① 降維 — 學習數據的低維潛在表示
② 特徵學習 — 學到的潛在表示作為原始數據的抽象特徵
③ 數據去噪（去噪自編碼器）— 從帶噪聲輸入重構乾淨數據
④ 異常偵測 — 重構正常數據誤差小、異常數據誤差大

右格 缺點 3 項（每項加教材原文補充）：
① 重構而非生成「新」數據（重構輸入，無法憑空生成多樣化全新樣本）
② 潛在空間缺乏結構（缺乏連續性或結構，採樣不保證生成有意義的數據）← 教材原文補充
③ 生成數據品質可能有限（純粹重構任務難學到全部數據分佈特性）

【適用情境 — 新增區塊，占下半約 28%】
標題：適用情境（教材原文行 1014）
四項：
① 降維與數據壓縮 — 為高維數據找到更緊湊的表示
② 特徵學習 — 作為無監督預訓練步驟，提供更好的特徵
③ 數據去噪 — 濾除數據中的噪聲
④ 異常偵測 — 辨識與訓練數據分佈不符的離群值

【絕對不要畫】
- 頁尾任何過頁鉤子文字（「→ 對抗生成 GAN 見 P13b」絕對刪除）
- 頁首橫幅內不可寫「P13b」「見 GAN」這類頁碼引用

版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。
```

建議輸出檔名：`L23203_p13a_sec3_5_autoencoder_v3.png`

---

# ⑤ P13b 重生 — 加一致的「生成式模型核心目標」共用橫幅

**舊檔保留**：`L23203_p13b_sec3_5_gan.png`（v1）+ `L23203_p13b_sec3_5_gan_v2.png`
**新檔名**：`L23203_p13b_sec3_5_gan_v3.png`

**動因**：P13a v3 改加了「生成式模型核心目標」共用節導論橫幅，P13b 也要加一致橫幅保持兩頁樣式統一。內容主視覺維持 v2 即可（本來就 OK）。

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字（「← Autoencoder」「→ 第 4 章 主流框架」「見 P13a」「見 P14」全部刪除）。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

教材原詞必須清楚出現：生成式模型、學習訓練數據的底層分佈（Underlying Distribution）、生成對抗網路（Generative Adversarial Network, GAN）、生成器（Generator）、判別器（Discriminator）、零和博弈（Zero-Sum Game）、隨機噪聲向量（Latent Vector）、高斯分佈、欺騙、二元分類器、納什均衡（Nash Equilibrium）、生成高品質數據、學習複雜分佈、無需顯示概率密度函數、訓練不穩定性（Training Instability）、模式崩潰（Mode Collapse）、超參數敏感、量化評估困難、Inception Score、FID、真實圖像生成、人臉、數據增強、圖像到圖像轉換、風格遷移、圖像修復、超解析度重建（Super-Resolution）、黑白圖像上色、跨模態生成。

【TERMS_RULE 覆寫 — v3 修復】
不要改寫為其他英文術語，不要省略教材括號中的英文詞。
- 版面結構必須與 P13a_v3 一致：頁首放「生成式模型核心目標」共用節導論橫幅（與 P13a 完全相同文字），下方才是本頁主標「② 生成對抗網路（GAN）」。
- 教材主詞「生成對抗網路」「生成器」「判別器」「零和博弈」「模式崩潰」「納什均衡」必須保留。
- 隨機噪聲向量可附 z ~ N(0, I) 視覺裝飾。
- 嚴禁出現任何過頁鉤子文字 — 頁尾「← Autoencoder 見 P13a；→ 第 4 章 主流框架 見 P14」整段刪除。

左上角標示「L23203」。

【頁首生成式模型核心目標橫幅】（占上方約 12%，與 P13a_v3 完全一致）
標題：3.（5）生成式模型
內文：學習訓練數據的底層分佈（Underlying Distribution），不只做預測，更能生成新的、與訓練數據相似但卻是前所未見的數據。
副註：兩種代表性生成式模型 ① 自編碼器（重構導向）+ ② 生成對抗網路 GAN（對抗生成）

【主標題】（橫幅下方獨立行）
寫「② 生成對抗網路（GAN）」— 配一個小手繪 icon（如兩個對抗的拳套或博弈棋盤）

【主視覺 — 占頁面上半 35%】
畫零和博弈（Zero-Sum Game）對抗示意圖：
- 左側 生成器（Generator）— 接收隨機噪聲向量（Latent Vector，高斯分佈採樣，可標 z ~ N(0, I)）→ 生成假樣本；目標：欺騙判別器
- 右側 判別器（Discriminator）— 接收真實數據與生成假數據混合 → 二元分類器（判真/判假）；目標：抓出生成器的假貨
- 中央雙向對抗箭頭，標出「對抗 / 互相學習 → 直到納什均衡（Nash Equilibrium）」

【版面下半切左右兩格 — 占約 50%】
左格 優點 + 缺點：
- 優點：①生成高品質數據 ②學習複雜分佈 ③無需顯示概率密度函數
- 缺點：訓練不穩定性（Training Instability）/ 模式崩潰（Mode Collapse）/ 超參數敏感 / 量化評估困難（Inception Score / FID）

右格 適用情境 4 項：
①真實圖像生成（人臉/動物/風景/藝術）
②數據增強
③圖像到圖像轉換（風格遷移 / 圖像修復 / 超解析度重建 Super-Resolution / 黑白圖像上色）
④跨模態生成

【絕對不要畫】
- 頁尾任何過頁鉤子文字
- 頁首橫幅內不可寫「P13a」「見 Autoencoder」這類頁碼引用

版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。
```

建議輸出檔名：`L23203_p13b_sec3_5_gan_v3.png`

---

# 自驗報告檢核點（艾冉跑完回報三件事）

1. **5 張 _v3 是否全到位**（檔名一字不差）：
   - `L23203_p11a_sec3_3_rnn_structure_v3.png`
   - `L23203_p12b_sec3_4_transformer_components_v3.png`
   - `L23203_p12c_sec3_4_transformer_variants_v3.png`
   - `L23203_p13a_sec3_5_autoencoder_v3.png`
   - `L23203_p13b_sec3_5_gan_v3.png`

2. **原圖完全保留**（v1 / v2 全部沒被覆蓋）

3. **三個關鍵 fix 是否生效**：
   - (a) **P11a 是否有獨立「關鍵特性」三區塊**（權重共享 / 展開視角 / 反向傳播）+ 「記憶」概念至少 3 處特殊色強調
   - (b) **P12b 是否有獨立「⑤ 前饋網路（FFN）」小卡**且副標寫「② 六大組成模組」（不是五大）
   - (c) **P12c 是否：優點 4 項都帶教材原文補充（不只標題）+ 新增「適用情境」3 大類區塊**
   - (d) **P13a 是否：頁首生成式模型核心目標橫幅 → 自編碼器主標 → 主視覺 → 優缺點 → 適用情境**（順序對教材原文）+ 缺點「潛在空間缺乏結構」有教材原文補充
   - (e) **P13b 頁首橫幅與 P13a_v3 完全一致**（共用節導論文字相同）
   - (f) **5 張頁尾都沒有「見 PXX」過頁鉤子文字**

4. **風險張**：你覺得有風險的張數列表 + 簡短原因（特別是 P12c 硬塞單頁是否字體被擠小、P13a 主標題位置是否真的在橫幅下方）

---

# 工作分配建議

可開 2 個 worker 並行（共 5 張）：
- **Worker 1**（3 張）：P11a_v3 / P12b_v3 / P12c_v3 — 結構性修正
- **Worker 2**（2 張）：P13a_v3 / P13b_v3 — 共用橫幅一致性

預估總時程：20–30 min（並行）

---

**Heiter 派工 done。**