# HANDOFF — L23203v2 第二波重生（13 張）

> 日期：2026-05-07
> 派工人：Heiter（mac-mini 駐守）
> 目標：依欣梅爾今早 review 修 L23203v2 共 13 張
> 圖檔規格：16:9 / 2048x1152 / 繁體中文清楚可讀
> 風格：手寫講義筆記（淡米白方格紙、黑色粗手寫標題、青綠底線、暖黃重點框、紅橘標註、多色手繪圓圈編號）

## 鎖死規則（每張都適用）

1. **絕對不要刪除或覆蓋任何既有 PNG**。新檔放到 `L23203_深度學習原理與框架v2/images/` 即可，原圖完全保留供欣梅爾挑圖。
2. **檔名一字不差**按本檔規定。
3. **嚴禁 codex 內部 cache pollution**：本章是 L23203，**絕對不要畫成 L23302「模型選擇與架構設計」**，章節 banner 不寫「第 5.2 節」，左上 L-code 寫 `L23203` 不是 `L23302`。
4. **絕對不要寫過頁鉤子**（不寫「見 P10b」、不寫「見 §3.(2) 卷積神經網路」、不寫「← 上一頁」「→ 下一頁」），每張圖靠主標+副標自帶編號自我說明。
5. 全頁僅左上角小灰字 L-code、右下角浮水印「AIOnDaily × 咖啡AI學」（透明度 35%）。

## 共用變數（每張 prompt 把這四個變數展開）

```
L_CODE = "L23203"

STYLE_BASE = "請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。"

TERMS_RULE = "不要改寫為其他英文術語，不要省略教材括號中的英文詞；可補充說明，但教材主詞需保留。"

LAYOUT_RULE = "版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。避免密密麻麻小字；公式若出現，請以手寫公式框呈現並保持符號正確。"
```

## 三個共通負向約束（每張 prompt 開頭都附）

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字（「見 P10a」「見 P10b」「← 上一頁」「→ 下一頁」「見 §3.(2)」等任何指向其他頁面的字樣）。
3. 嚴禁出現右上角頁碼。
```

---

## 派工分組（A 組 4 張結構修 / B 組 2 張內文修 / C 組 7 張純清鉤子）

可一次派 3 worker 並行，每組各一個 worker，C 組量最大可拆兩個 worker。

---

# A 組 — 結構性修正（4 張）

## A1. P02 重生｜2. 深度學習基本概念

**舊檔保留**：`L23203_p02_sec2_basic_concepts_overview_v2.png`
**新檔名**：`L23203_p02_sec2_basic_concepts_overview_v3.png`

**動因**：圖上 ④損失函數小卡寫「梯度下降法」，但教材 §（4）損失函數與優化器整段（行 232–266）完全沒提到「梯度下降法」 — 那是 §（3）權重更新段（行 225）才出現的詞。屬 C 類跨節腦補。

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字（「見 P10a」「見 P10b」「← 上一頁」「→ 下一頁」「見 §3.(2)」等任何指向其他頁面的字樣）。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

教材原詞必須清楚出現：深度學習基本概念、人工神經元、感知器、激活函數、前向傳播、反向傳播、損失函數、優化器、過擬合、正則化技術。

【TERMS_RULE 覆寫 — v3 修復】
不要改寫為其他英文術語，不要省略教材括號中的英文詞。
- ④損失函數與優化器小卡內，只能寫「最佳化器（Optimizer）」教材原詞。
- 嚴禁出現「梯度下降法」「SGD」「Adam」「RMSProp」「Adagrad」「Adadelta」等任何具體優化器算法或梯度法名稱（教材 §（4）整段沒提到，v2 P02 寫了「梯度下降法」是跨節塞 §（3）內容，本次必修）。
- ⑤過擬合與正則化技術小卡內，正則化清單只能列教材的五項：L1（Lasso）、L2（Ridge）、Elastic Net、Dropout、早停法（Early Stopping）。嚴禁出現「資料增強」「Batch Normalization」「Layer Normalization」等教材未列項目。

左上角標示「L23203」。主標題寫「2. 深度學習基本概念」。作為第 2 章導讀頁：點出本章將介紹深度學習的五大基本概念，作為理解後續模型架構的基礎。版面下方留五個指向小區塊：「人工神經元與感知器概念」「激活函數的角色」「前向傳播與反向傳播原理」「損失函數與優化器」「過擬合與正則化技術」。每個小區塊只能列教材原文出現的關鍵詞（見上方 TERMS_RULE 覆寫鎖死清單）。④損失函數與優化器小卡可以畫一個簡化的損失曲線圖示與「最佳化器（Optimizer）」字樣，但絕對不要寫「梯度下降法」。⑤過擬合與正則化技術小卡列五項正則化技術即可。

版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。避免密密麻麻小字。
```

---

## A2. P06 重生｜2.（4）損失函數與優化器

**舊檔保留**：`L23203_p06_sec2_4_loss_optimizer.png`（v1 沿用）
**新檔名**：`L23203_p06_sec2_4_loss_optimizer_v2.png`

**動因**：
- MSE 小卡寫「對較大誤差（殘差/離群值）的敏感度高」 → 教材沒寫，C 類腦補
- MAE 小卡漏了教材原文「對極端值（離群值）的敏感度較低」
- 交叉熵主敘寫「差異」 → 教材原文是「距離」
- 二元 / 類別交叉熵敘述偏離教材原文
- BCE / CCE 數學公式 → 教材未給，C 類腦補

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

教材原詞必須清楚出現：損失函數（Loss Function）、優化器（Optimizer）、衡量模型預測結果與真實值之間誤差、單一的數值、評估誤差、指引優化、迴歸問題、預測連續值、均方誤差（Mean Squared Error, MSE）、平均絕對誤差（Mean Absolute Error, MAE）、極端值（離群值）、敏感度、分類問題、預測離散類別、交叉熵損失（Cross-Entropy Loss）、對數損失（Log Loss）、機率分佈、二元交叉熵、判斷是或否、二元分類、類別交叉熵、多種不同類別、多分類問題。

【TERMS_RULE 覆寫 — v2 修復】
不要改寫為其他英文術語，不要省略教材括號中的英文詞。
- MSE 小卡內只能寫「計算預測值與真實值之差的平方平均值」教材原文敘述；嚴禁出現「對較大誤差（殘差/離群值）的敏感度高」「對較大誤差敏感度較大」等教材未列的敏感度描述（v2 P06 寫了此句為 C 類腦補，本次必修）。
- MAE 小卡內必須出現教材原文「對極端值（離群值）的敏感度較低」（v2 P06 漏寫，本次必補）；嚴禁省略括號內的「離群值」中文補述。
- 交叉熵主敘必須使用教材原文「衡量模型預測的機率分佈與真實類別分佈之間的『距離』」；嚴禁寫「差異」「差距」等替代詞（v2 P06 寫了「差異」為錯字，本次必修）。
- 二元交叉熵敘述必須照教材原文逐字寫「用於判斷是或否的二元分類」。
- 類別交叉熵敘述必須照教材原文逐字寫「用於多種不同類別的多分類問題」。
- 嚴禁出現 BCE 數學公式（-Σ[y log ŷ + (1-y)log(1-ŷ)] 或任何變形）與 CCE 數學公式（-Σy log p 或任何變形）— 教材未給具體公式（v2 P06 寫了兩條公式為 C 類腦補，本次必修）。

左上角標示「L23203」。主標題寫「2.（4）損失函數與優化器」。

上半畫損失函數（Loss Function）= 量尺示意：模型預測 vs 真實值的差距 → 單一數值，值越小表現越好；標出兩個目的「評估誤差」「指引優化」並用箭頭連到優化器（Optimizer），優化器目標是讓損失最小化。

下半切左右兩格依任務類型對應損失函數：
①迴歸問題（預測連續值）— 兩個小卡：
  - 均方誤差（Mean Squared Error, MSE）：計算預測值與真實值之差的平方平均值
    （只寫教材原文敘述，不寫任何敏感度描述）
    可附公式 MSE = (1/n)Σ(yᵢ - ŷᵢ)²
  - 平均絕對誤差（Mean Absolute Error, MAE）：計算預測值與真實值之差的絕對值平均值
    對極端值（離群值）的敏感度較低 ← 教材原文必須出現
    可附公式 MAE = (1/n)Σ|yᵢ - ŷᵢ|

②分類問題（預測離散類別）— 交叉熵損失（Cross-Entropy Loss）又稱對數損失（Log Loss）：
  衡量模型預測的機率分佈與真實類別分佈之間的「距離」
  下分兩類：
  - 二元交叉熵：用於判斷是或否的二元分類
  - 類別交叉熵：用於多種不同類別的多分類問題
  （兩條敘述照教材原文逐字寫，不附 BCE/CCE 數學公式）

版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。
```

---

## A3. P07 重生｜2.（5）過擬合與正則化技術

**舊檔保留**：`L23203_p07_sec2_5_overfitting_regularization.png`（v1 沿用）
**新檔名**：`L23203_p07_sec2_5_overfitting_regularization_v2.png`

**動因**：右上「過擬合常見原因」三項主敘+副敘對位錯誤
- 模型過於複雜 → 沒寫「參數數量過多、網路層次過深」教材原文主因
- 訓練數據不足 → 副敘抓錯（教材是「無法從足夠多樣的例子中學習到通用的特徵」）
- 訓練時間過長 → 副敘錯誤抓到「噪音與特有模式」（那是①的副敘述被誤搬到③，教材③只說「過度適應訓練數據」）

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

教材原詞必須清楚出現：過擬合（Overfitting）、訓練資料、新數據、泛化能力、正則化技術（Regularization Techniques）、模型過於複雜、參數數量過多、網路層次過深、噪聲、特有模式、訓練數據不足、無法從足夠多樣的例子中學習到通用的特徵、訓練時間過長、過度適應訓練數據、訓練集、驗證集、測試集、損失、準確率、L1 正則化（L1 Regularization / Lasso Regularization）、權重的絕對值總和、特徵選擇、L2 正則化（L2 Regularization / Ridge Regularization）、權重平方和、Elastic Net、Dropout、隨機屏蔽部分神經元、早停法（Early Stopping）、驗證集損失。

【TERMS_RULE 覆寫 — v2 修復】
不要改寫為其他英文術語，不要省略教材括號中的英文詞。
- 過擬合常見原因三項主敘+副敘嚴格按教材原文配對，不可跨層串接：
  ① 模型過於複雜
     主敘：參數數量過多、網路層次過深（教材原文必須出現此七字主因）
     副敘：開始「記憶」訓練數據中的噪聲和特有模式
  ② 訓練數據不足
     主敘：訓練數據量相對於模型複雜度太少
     副敘：無法從足夠多樣的例子中學習到通用的特徵（教材原文必須出現「通用的特徵」）
  ③ 訓練時間過長
     主敘：即使模型和數據量都適中，訓練時間過長
     副敘：導致模型過度適應訓練數據（教材原文必須出現「過度適應訓練數據」）
- 嚴禁把「噪聲和特有模式」「噪音與特有模式」放到「訓練時間過長」底下（v1 P07 圖把①的副敘述複製到③，本次必修）。
- 嚴禁把「底層的普遍規律」放到「訓練數據不足」底下（教材是把「底層的普遍規律」放在「模型過於複雜」段裡）。

左上角標示「L23203」。主標題寫「2.（5）過擬合與正則化技術」。

版面分上下兩半：

上半「過擬合（Overfitting）」
- 中央用一條「訓練 loss 低但驗證 loss 高」的雙曲線圖示說明症狀
- 旁邊條列三個發生原因（主敘+副敘嚴格按上方鎖死配對）：
  ① 模型過於複雜 — 參數數量過多、網路層次過深 → 開始「記憶」訓練數據中的噪聲和特有模式
  ② 訓練數據不足 — 相對於模型複雜度太少 → 無法從足夠多樣的例子中學習到通用的特徵
  ③ 訓練時間過長 — 即使模型和數據量都適中 → 導致模型過度適應訓練數據

下半「正則化技術（Regularization Techniques）— 懲罰機制」
五個圓圈/卡片並排：
①L1 正則化（Lasso）權重絕對值和 → 特徵選擇
②L2 正則化（Ridge）權重平方和 → 平滑穩定
③Elastic Net 結合 L1+L2
④Dropout 訓練時隨機屏蔽神經元
⑤早停法（Early Stopping）驗證集損失不再下降即停

版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。
```

---

## A4. P10a 重生｜3.（2）卷積神經網路（CNN） — ① 模型結構與運作

**舊檔保留**：`L23203_p10a_sec3_2_cnn_structure.png`
**新檔名**：`L23203_p10a_sec3_2_cnn_structure_v2.png`

**動因**：
- 圖上「CNN 核心機制」獨立小卡 + 卷積運算數學公式 y(i,j)=ΣΣx·k → 教材無此標題段，C 類腦補
- 「層次化特徵抽取」字樣 → 教材無此詞，C 類腦補
- 漏寫教材原文「運作原理」獨立段（行 486–496）
- 漏寫教材原文「適用情境」獨立段（行 534–550）
- 圖右下「→ 衍伸模型時間軸見 P10b」 → 過頁鉤子刪除

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字（「見 P10b」「→ 衍伸模型時間軸」這類指向下一頁的字樣全部刪除）。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

教材原詞必須清楚出現：卷積神經網路（Convolution Neural Network, CNN）、前饋神經網路、卷積層（Convolutional Layers）、池化層（Pooling Layers）、局部相關性、空間層次結構、電腦視覺、卷積核/濾波器（Kernel/Filter）、卷積運算、特徵映射（Feature Map）、邊緣、紋理、顏色區塊、權重共享（Weight Sharing）、位置不變、激活函數層（Activation Layer）、ReLU、池化層（Pooling Layer）、降採樣、平移不變性、最大池化（Max Pooling）、平均池化（Average Pooling）、全連接層（Fully Connected Layer / Dense Layer）、扁平化、Softmax、運作原理、前向傳播、反向傳播、損失、自動特徵提取、權重共享與局部連接、平移、縮放、旋轉、不變性、魯棒性、計算資源、GPU、標註數據、模型可解釋性、黑箱、適用情境、圖像辨識與分類、物體辨識、人臉辨識、醫學圖像診斷、手寫數字辨識、圖像分割、自然語言處理、文本分類、情感分析、語音辨識、頻譜圖。

【TERMS_RULE 覆寫 — v2 修復】
不要改寫為其他英文術語，不要省略教材括號中的英文詞。
- 嚴禁出現「CNN 核心機制」「核心機制」獨立小卡 — 教材沒有此標題段（v1 P10a 自行加上為 C 類腦補，本次必修）。
- 嚴禁出現卷積運算數學公式 y(i,j)=ΣΣ x(i+m,j+n)·k(m,n) 或任何變形 — 教材未給具體公式（v1 P10a 自行加上為 C 類腦補，本次必修）。
- 嚴禁出現「層次化特徵抽取（Hierarchical Feature Extraction）」字樣 — 教材原文沒這個詞（教材寫的是「逐步提取出越來越抽象的特徵」）。
- 「權重共享（Weight Sharing）」「局部連接 / 局部相關性」可以保留，但只能寫在「卷積層」說明標註裡（教材原文位置），不可獨立成小卡。
- 必須有「運作原理」獨立小卡，內文必須包含教材原文「CNN 的訓練過程與 MLP 類似，也依賴於前向傳播和反向傳播」。
- 必須有「適用情境」獨立小卡，必須完整列出教材原文 4 項：圖像辨識與分類（物體辨識/人臉辨識/醫學圖像診斷/手寫數字辨識）、圖像分割、自然語言處理（文本分類/情感分析）、語音辨識（頻譜圖處理）。
- 本頁只畫 CNN 模型結構與運作 + 運作原理 + 優缺點 + 適用情境，不要畫衍伸模型時間軸（衍伸模型在另一頁），也不要在本頁任何位置寫「見 P10b」「→ 衍伸模型」這類過頁字樣。

左上角標示「L23203」。主標題寫「3.（2）卷積神經網路（Convolution Neural Network, CNN）」，副標寫「① 模型結構與運作」。

【頁首導論橫幅】（細條）
CNN 是一類前饋神經網路，核心是卷積層 + 池化層，能有效捕捉局部相關性與空間層次結構，是電腦視覺領域的基石。

【主視覺 — 占頁面上半】
畫一條完整的 CNN 流程：輸入圖像（標 224×224×3 為示例）→ 卷積層（卷積核/濾波器 Kernel/Filter 滑動 → 特徵映射 Feature Map + 權重共享 Weight Sharing → 偵測邊緣/紋理/顏色區塊）→ 激活函數層（ReLU）→ 池化層（最大池化 Max Pooling / 平均池化 Average Pooling 降採樣 → 平移不變性）→ ⋯ 多層堆疊 → 扁平化 → 全連接層（Dense Layer）→ Softmax 輸出。

【中段獨立小卡 — 運作原理】（必須有此區塊）
標題：運作原理
內文：CNN 的訓練過程與 MLP 類似，也依賴於前向傳播和反向傳播：
- 前向傳播：輸入數據 → 卷積層 / 激活層 / 池化層 → 全連接層 → 預測結果
- 反向傳播與優化：計算預測 vs 真實標籤的損失 → 梯度反向傳播 → 更新卷積核權重 / 全連接層權重 / 偏置 → 最小化損失

【下半 2x2 四格】優點 + 缺點
①優點 — 自動特徵提取 / 權重共享與局部連接 / 對平移縮放旋轉的不變性 / 高效處理高維數據
②缺點 — 計算資源需求大（GPU）/ 對數據量要求高 / 模型可解釋性低（黑箱）/ 對大角度旋轉尺度變化的不變性有限

【右下獨立小卡 — 適用情境】（必須有此區塊）
標題：適用情境
四項並列（教材原文）：
- 圖像辨識與分類：物體辨識 / 人臉辨識 / 醫學圖像診斷 / 手寫數字辨識
- 圖像分割：將圖像中的每個像素點分類到特定的對象類別
- 自然語言處理：文本分類 / 情感分析（提取詞語或短語的局部特徵）
- 語音辨識：處理語音訊號的頻譜圖

版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。
```

---

# B 組 — 內文小修（1 張）

## B1. P10b 重生｜3.（2）卷積神經網路（CNN） — ② 衍伸模型時間軸

**舊檔保留**：`L23203_p10b_sec3_2_cnn_evolution.png`
**新檔名**：`L23203_p10b_sec3_2_cnn_evolution_v2.png`

**動因**：拿掉右下「小註」整個區塊（「本頁僅 AlexNet 標 2012 年...」）+ 拿掉頁尾「← CNN 結構與運作見 P10a；→ 下一個模型 RNN 見 P11a」過頁鉤子。

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字（「見 P10a」「見 P11a」「← CNN 結構」「→ 下一個模型」「→ RNN」全部刪除）。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

教材原詞必須清楚出現：卷積神經網路（Convolution Neural Network, CNN）、AlexNet、ImageNet、ILSVRC、ReLU、Dropout、GPU、VGG（Visual Geometry Group）、3×3 小型卷積核、GoogLeNet（Inception）、Inception 模塊、多尺度特徵、ResNet（Residual Network）、殘差連接、跳躍連接、梯度消失、模型退化、DenseNet（Dense Convolutional Network）、特徵重用、MobileNet、EfficientNet、深度可分離卷積、移動設備。

【TERMS_RULE 覆寫 — v2 修復】
不要改寫為其他英文術語，不要省略教材括號中的英文詞。
- 衍伸模型時間軸只能標註 AlexNet 2012（教材原文有），其餘 5 個模型（VGG / GoogLeNet / ResNet / DenseNet / MobileNet / EfficientNet）絕對不能加上 2014 / 2015 / 2016 / 2017 等年份標註。
- 衍伸模型 AlexNet / VGG / GoogLeNet / ResNet / DenseNet / MobileNet / EfficientNet 名稱必須完整保留。
- 嚴禁出現「小註」「本頁僅 AlexNet 標 2012 年」這類自我說明區塊。
- 嚴禁出現任何過頁鉤子文字（「← CNN 結構與運作見 P10a」「→ 下一個模型 RNN 見 P11a」全部刪除）。

左上角標示「L23203」。主標題寫「3.（2）卷積神經網路（Convolution Neural Network, CNN）」，副標寫「② 衍伸模型時間軸」。

【頁首導論橫幅】（細條）
自 2012 年 AlexNet 以來，CNN 在電腦視覺領域演進出多個重要里程碑模型，以下依教材順序列出 6 個代表性架構及其核心創新。

【主視覺 — 占頁面中央】
畫一條從左到右的橫向時間軸 / 演進箭頭，串起六個里程碑卡片，每張卡片用不同色塊區分但只在 AlexNet 標年份：
1. AlexNet（2012 ImageNet ILSVRC 冠軍）— 引入 ReLU 激活函數 + Dropout 正則化 + GPU 加速訓練；CNN 復興起點。
2. VGG（Visual Geometry Group）— 極深網路 + 3×3 小型卷積核堆疊取代大卷積核；證明深度的重要性。
3. GoogLeNet（Inception）— Inception 模塊 + 多尺度特徵並行抽取。
4. ResNet（Residual Network）— 殘差連接（跳躍連接）解決梯度消失與模型退化問題；超深網路成為可能。
5. DenseNet（Dense Convolutional Network）— 密集連接 + 特徵重用，最大化資訊流。
6. MobileNet / EfficientNet — 深度可分離卷積 + 輕量化設計，適合移動設備部署。

【左下小卡 — 關鍵創新總結】
ReLU 激活、Dropout 提升訓練穩定與泛化；3x3 小型卷積核堆疊；Inception 模塊多尺度特徵；殘差連接 ResNet；特徵重用 DenseNet；深度可分離卷積 MobileNet/EfficientNet。

【絕對不要畫】
- 右下「小註」區塊（拿掉）
- 頁尾任何過頁鉤子文字

版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。
```

---

# C 組 — 純清過頁鉤子（7 張，主視覺與內文不動）

C 組共 7 張，每張只動一處：**移除頁尾「← XX 見 P11a；→ XX 見 P12a」這類過頁鉤子文字**，主視覺與內文照舊。

每張的 prompt = 既有 v2 prompts.md 該頁原文 + 「【鉤子刪除】嚴禁出現任何過頁鉤子文字」覆寫指令。

---

## C1. P11a 重生

**舊檔保留**：`L23203_p11a_sec3_3_rnn_structure.png`
**新檔名**：`L23203_p11a_sec3_3_rnn_structure_v2.png`

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字（「見 P11b」「→ 衍伸模型」「LSTM/GRU/Bi-RNN/Deep RNN 見」全部刪除）。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

教材原詞必須清楚出現：遞迴神經網路（Recurrent Neural Network, RNN）、可變長度序列輸入數據（Sequential Data）、前饋神經網路、MLP、CNN、內部「記憶」機制、時間依賴性、上下文資訊、循環連接（Recurrent Connections）、時間步、輸入（Xt）、隱藏狀態（Ht）、上一個時間步的隱藏狀態（Ht-1）、Tanh、ReLU、輸出（Ot）、權重共享（Weight Sharing）、任意長度的序列、「展開」視角（Unrolled View）、深度前饋網路、時間上的反向傳播（Backpropagation Through Time, BPTT）、鏈式法則、梯度消失（Vanishing Gradient Problem）、梯度爆炸（Exploding Gradient Problem）、長期依賴問題、訓練速度慢、串行、平行計算。

【TERMS_RULE 覆寫】
不要改寫為其他英文術語，不要省略教材括號中的英文詞。
- 版面頂部必須留出主標題列「3.（3）遞迴神經網路（Recurrent Neural Network, RNN）」與左上 L-code「L23203」。
- 本頁只畫 RNN 結構與運作 + BPTT 訓練 + 缺點，不要畫衍伸模型 LSTM/GRU/Bi-RNN/Deep RNN。
- 嚴禁出現「Sequence to Sequence (Seq2Seq)」（教材未提）。
- 嚴禁出現任何過頁鉤子文字 — 頁尾「→ 衍伸模型 LSTM/GRU/Bi-RNN/Deep RNN 見 P11b」整段刪除。

左上角標示「L23203」。主標題寫「3.（3）遞迴神經網路（Recurrent Neural Network, RNN）」，副標寫「① 結構與運作 + BPTT 訓練」。

【頁首導論橫幅】（細條）
相較於 MLP/CNN 的前饋結構，RNN 引入循環連接（Recurrent Connections）建立內部「記憶」機制，能處理可變長度序列輸入數據（Sequential Data）並捕捉時間依賴性與上下文資訊。

【主視覺 — 占頁面上半】
左側畫 RNN 基本單元（折疊形式）：時間步 t 接收當前輸入 Xt + 上一個時間步隱藏狀態 Ht-1 → 透過權重加權求和 + 非線性激活函數（Tanh/ReLU）→ 新隱藏狀態 Ht → 產生輸出 Ot；中央畫一個明顯的「自我循環」箭頭強調 Recurrent Connection；右側展示「展開」視角（Unrolled View）= 沿時間軸展開的深度前饋網路（每個時間步共享相同權重 Weight Sharing），畫 4-5 個時間步的串接。

【訓練機制小卡】（中段）
時間上的反向傳播（Backpropagation Through Time, BPTT）— 依鏈式法則沿時間軸反向更新；標出兩大長期依賴問題：梯度消失（Vanishing Gradient Problem）與梯度爆炸（Exploding Gradient Problem）。

【版面下方優缺點兩格】
①優點 — 處理序列數據時間依賴 / 權重共享 / 任意長度序列
②缺點 — 長期依賴問題（梯度消失 / 梯度爆炸）、訓練速度慢（串行難平行計算）、難捕捉超長距離依賴

【絕對不要畫】
- 頁尾任何過頁鉤子文字

版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。
```

---

## C2. P11b 重生

**舊檔保留**：`L23203_p11b_sec3_3_rnn_variants.png`
**新檔名**：`L23203_p11b_sec3_3_rnn_variants_v2.png`

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字（「← RNN 結構」「→ Transformer」「見 P11a」「見 P12a」全部刪除）。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

教材原詞必須清楚出現：遞迴神經網路（Recurrent Neural Network, RNN）、長短期記憶網路（Long Short-Term Memory, LSTM）、門控機制、輸入門 Input Gate、遺忘門 Forget Gate、輸出門 Output Gate、細胞狀態（Cell State）、門控循環單元（Gated Recurrent Unit, GRU）、更新門 Update Gate、重置門 Reset Gate、雙向遞迴神經網路（Bidirectional RNN, Bi-RNN）、深度遞迴神經網路（Deep RNN）、自然語言處理（NLP）、機器翻譯、語音辨識、文本生成、情感分析、命名實體辨識、時間序列預測、股票價格、天氣預報、影片處理。

【TERMS_RULE 覆寫】
不要改寫為其他英文術語，不要省略教材括號中的英文詞。
- 版面頂部必須留出主標題列與左上 L-code「L23203」。
- 衍伸模型 LSTM / GRU / Bi-RNN / Deep RNN 全名必須完整保留。
- 嚴禁出現「Sequence to Sequence (Seq2Seq)」（教材未提）。
- 嚴禁出現任何過頁鉤子文字 — 頁尾「← RNN 結構與 BPTT 見 P11a；→ 下一個模型 Transformer 見 P12a」整段刪除。

左上角標示「L23203」。主標題寫「3.（3）遞迴神經網路（Recurrent Neural Network, RNN）」，副標寫「② 衍伸模型 + 適用情境」。

【頁首導論橫幅】（細條）
為解決基本 RNN 的長期依賴問題與表達能力，發展出四個重要衍伸架構，每個針對特定問題優化。

【主視覺 — 占頁面中央】
四個衍伸模型小卡並列：
1. LSTM（Long Short-Term Memory，長短期記憶網路）— 引入門控機制：輸入門 Input Gate + 遺忘門 Forget Gate + 輸出門 Output Gate + 細胞狀態（Cell State）解梯度消失，能保留長期記憶；可畫一個 LSTM 細胞示意，三道閘門 + 一條長期細胞狀態流。
2. GRU（Gated Recurrent Unit，門控循環單元）— LSTM 簡化版：更新門 Update Gate + 重置門 Reset Gate，效能相近但參數更少。
3. Bi-RNN（Bidirectional RNN，雙向遞迴神經網路）— 兩個 RNN 同時處理「過去 → 現在」與「未來 → 現在」，整合前後雙向上下文資訊。
4. Deep RNN（深度遞迴神經網路）— 多層 RNN 堆疊，每一層的輸出作為下一層的輸入，提升表達能力。

【版面下半適用情境條帶】
①NLP（機器翻譯 / 語音辨識 / 文本生成 / 情感分析 / 命名實體辨識）
②時間序列預測（股票價格 / 天氣預報）
③影片處理

【絕對不要畫】
- 頁尾任何過頁鉤子文字

版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。
```

---

## C3. P12a 重生

**舊檔保留**：`L23203_p12a_sec3_4_transformer_overview.png`
**新檔名**：`L23203_p12a_sec3_4_transformer_overview_v2.png`

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字（「→ 五大組成模組」「見 P12b」全部刪除）。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

教材原詞必須清楚出現：Transformer 架構、自然語言處理（NLP）、《Attention Is All You Need》、Google、2017 年、RNN/LSTM、注意力機制（Attention Mechanism）、循環結構、卷積結構、自注意力機制、長距離依賴關係、長期依賴問題、並行化困難、編碼器（Encoder）、解碼器（Decoder）、編碼器堆疊（Encoder Stack）、多頭自注意力機制、前饋網路、上下文表示、解碼器堆疊（Decoder Stack）、帶遮罩的多頭自注意力機制（Masked Multi-head Self-Attention）、編碼器-解碼器（Encoder-Decoder）注意力機制、前饋網路（Feed-forward Network, FFN）、自迴歸生成。

【TERMS_RULE 覆寫】
不要改寫為其他英文術語，不要省略教材括號中的英文詞。
- 本頁只畫 Transformer 來源 + Encoder/Decoder 雙塔架構，不要展開五大組成模組，不要畫衍伸模型。
- 嚴禁出現 `<BOS>` 起始標誌（教材原文未提）。
- 嚴禁出現任何過頁鉤子文字 — 頁尾「→ 五大組成模組（注意力 / Q/K/V / 多頭 / 位置編碼 / 殘差+LN）見 P12b」整段刪除。

左上角標示「L23203」。主標題寫「3.（4）Transformer 架構」，副標寫「① 來源 + 編碼器/解碼器堆疊」。

【頁首來源橫幅】（占上方 1/4）
標出 Google 2017 年發表《Attention Is All You Need》，旁邊畫一個書本/論文 icon；下方註解 — 解決 RNN/LSTM 的兩大痛點：①長期依賴問題（即使有 LSTM 仍難處理超長距離依賴）+ ②並行化困難（序列性運算難以平行）；Transformer 完全捨棄循環結構與卷積結構，只用自注意力機制與前饋網路。

【主視覺 — 占頁面中央】
畫雙塔對稱架構圖：
- 左塔 編碼器堆疊（Encoder Stack）— 由 N 層編碼器堆疊（教材示意 N=6），每層 = 多頭自注意力機制（Multi-head Self-Attention）+ 前饋網路（Feed-forward Network, FFN）；輸入序列經編碼器產生上下文表示。
- 右塔 解碼器堆疊（Decoder Stack）— 由 N 層解碼器堆疊，每層 = 帶遮罩的多頭自注意力機制（Masked Multi-head Self-Attention）+ 編碼器-解碼器（Encoder-Decoder）注意力機制 + 前饋網路（FFN）；負責自迴歸生成輸出序列。
- 橫向箭頭：編碼器最後一層的上下文表示送入解碼器每一層的 Encoder-Decoder Attention。

【版面下方小註】
原始任務為機器翻譯（input → output 序列轉換），後續延伸到語言理解 / 生成 / 視覺等多領域。

【絕對不要畫】
- 頁尾任何過頁鉤子文字

版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。
```

---

## C4. P12b 重生

**舊檔保留**：`L23203_p12b_sec3_4_transformer_components.png`
**新檔名**：`L23203_p12b_sec3_4_transformer_components_v2.png`

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字（「← 雙塔架構」「→ 衍伸模型」「見 P12a」「見 P12c」全部刪除）。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

教材原詞必須清楚出現：注意力機制（Attention Mechanism）、自注意力（Self-Attention）、查詢向量（Query, Q）、鍵向量（Key, K）、值向量（Value, V）、線性變換、多頭注意力機制（Multi-Head Attention）、表示子空間、拼接與線性轉換、位置編碼（Positional Encoding）、詞嵌入（Word Embeddings）、正弦和餘弦函數、殘差連接（Residual Connections）、跳躍連接、層歸一化（Layer Normalization, LN）、批次歸一化（Batch Normalization）、內部協變偏移（Internal Covariate Shift, ICS）、上下文向量、加權求和。

【TERMS_RULE 覆寫】
不要改寫為其他英文術語，不要省略教材括號中的英文詞。
- 位置編碼必須拼為「Positional Encoding」（嚴禁誤拼成 Postional Encoding）。
- 位置編碼處用文字描述「正弦和餘弦函數（sinusoidal / cosine functions）」即可，不要寫具體公式 sin(pos/10000^{2i/d})、cos(pos/10000^{2i/d})。
- Q/K/V 向量必須以「查詢向量（Query, Q）」「鍵向量（Key, K）」「值向量（Value, V）」教材原文形式呈現。
- 嚴禁出現任何過頁鉤子文字 — 頁尾「← 雙塔架構見 P12a；→ 衍伸模型 BERT/GPT/T5/ViT/長序列 見 P12c」整段刪除。

左上角標示「L23203」。主標題寫「3.（4）Transformer 架構」，副標寫「② 五大組成模組」。

【頁首導論橫幅】（細條）
Transformer 不靠循環結構，而是由五大可疊加模組組合而成；以下依教材順序逐一介紹。

【主視覺 — 占頁面中央】
五個模組小卡並列（橫向 5 格），每張卡用不同手繪色塊區分：
1. 注意力機制（Attention Mechanism）— 核心思想：動態關注序列中重要片段，不再受序列長度線性遞減限制；輸出 = 加權求和上下文向量。
2. 自注意力（Self-Attention）— Q/K/V 三向量公式：查詢向量（Query, Q）= 「我在找什麼」/ 鍵向量（Key, K）=「我能提供什麼」/ 值向量（Value, V）=「被關注時提供什麼」；三者皆由輸入經線性變換得到。
3. 多頭注意力機制（Multi-Head Attention）— 拆分 → 並行 h 個頭 → 各自學習不同表示子空間 → 拼接與線性轉換組合。
4. 位置編碼（Positional Encoding）— 為解決自注意力本身無序，注入正弦和餘弦函數（sinusoidal / cosine functions）形式的位置資訊到詞嵌入（Word Embeddings）；用文字描述即可，不寫具體 sin/cos 公式。
5. 殘差連接（Residual Connections，跳躍連接）+ 層歸一化（Layer Normalization, LN）— 殘差連接緩解梯度消失，層歸一化（相較於批次歸一化 Batch Normalization）解決內部協變偏移（Internal Covariate Shift, ICS）。

【版面下方箭頭】
五大模組組合 → Encoder 層或 Decoder 層的內部結構（呼應雙塔架構圖）。

【絕對不要畫】
- 頁尾任何過頁鉤子文字

版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。
```

---

## C5. P12c 重生

**舊檔保留**：`L23203_p12c_sec3_4_transformer_variants.png`
**新檔名**：`L23203_p12c_sec3_4_transformer_variants_v2.png`

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字（「← 五大組成模組」「→ 下一個模型 生成式模型」「見 P12b」「見 P13a」全部刪除）。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

教材原詞必須清楚出現：捕捉長距離依賴、高度並行化、遷移學習和預訓練模型、O（L²）、計算複雜度、記憶體消耗、數據飢渴、序列歸納偏置、BERT（Bidirectional Encoder Representations from Transformers）、Masked Language Model、Next Sentence Prediction、GPT（Generative Pre-trained Transformer）、GPT-2、GPT-3、GPT-4、GPT-5、零樣本（Zero-shot）、少樣本（Few-shot）、T5（Text-to-Text Transfer Transformer）、Vision Transformer（ViT）、Patches、長序列 Transformer、Longformer、Reformer、Performer、稀疏注意力（Sparse Attention）、局部注意力（Local Attention）、tokens。

【TERMS_RULE 覆寫】
不要改寫為其他英文術語，不要省略教材括號中的英文詞。
- 衍伸模型 BERT / GPT / T5 / ViT / Longformer / Reformer / Performer 名稱必須完整保留。
- GPT 系列必須完整列出 GPT-2 / GPT-3 / GPT-4 / GPT-5。
- 嚴禁出現任何過頁鉤子文字 — 頁尾「← 五大組成模組見 P12b；→ 下一個模型 生成式模型 見 P13a」整段刪除。

左上角標示「L23203」。主標題寫「3.（4）Transformer 架構」，副標寫「③ 衍伸模型族譜 + 優缺點」。

【頁首優缺點橫幅】（占上方 1/3，左右兩格）
- 左格 優點 — ①捕捉長距離依賴 ②高度並行化 ③表示學習能力強 ④遷移學習和預訓練模型基石
- 右格 缺點 — ①O(L²) 計算複雜度（隨序列長度平方成長） ②記憶體消耗大 ③數據飢渴（需大量資料訓練） ④缺乏內建序列歸納偏置（需位置編碼補上）

【主視覺 — 占頁面下半 2/3】
衍伸模型族譜五個小卡並列，按教材順序：
1. BERT（Bidirectional Encoder Representations from Transformers）— 雙向編碼器，預訓練任務 = Masked Language Model（MLM）+ Next Sentence Prediction（NSP）；強於語言理解。
2. GPT 系列（Generative Pre-trained Transformer）— 解碼器自迴歸生成；GPT-2 / GPT-3 / GPT-4 / GPT-5；零樣本（Zero-shot）/ 少樣本（Few-shot）能力。
3. T5（Text-to-Text Transfer Transformer）— 把所有 NLP 任務統一為「文字進、文字出」格式。
4. Vision Transformer（ViT）— 將圖像切成 Patches 視為「詞語」進電腦視覺領域。
5. 長序列 Transformer — Longformer / Reformer / Performer，使用稀疏注意力（Sparse Attention）/ 局部注意力（Local Attention）處理超長 tokens 序列。

【絕對不要畫】
- 頁尾任何過頁鉤子文字

版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。
```

---

## C6. P13a 重生

**舊檔保留**：`L23203_p13a_sec3_5_autoencoder.png`
**新檔名**：`L23203_p13a_sec3_5_autoencoder_v2.png`

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字（「→ 對抗生成 GAN」「見 P13b」全部刪除）。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

教材原詞必須清楚出現：生成式模型、學習訓練數據的底層分佈（Underlying Distribution）、自編碼器（Autoencoder）、編碼器（Encoder）、解碼器（Decoder）、潛在空間向量、瓶頸層（Bottleneck Layer）、重構誤差（Reconstruction Error）、均方誤差（MSE）、二元交叉熵、降維、特徵學習、數據去噪、去噪自編碼器、異常偵測、重構而非生成「新」數據、潛在空間缺乏結構。

【TERMS_RULE 覆寫】
不要改寫為其他英文術語，不要省略教材括號中的英文詞。
- 重構誤差用文字描述「常用均方誤差（MSE）與二元交叉熵」即可，不要寫具體數學公式 L_recon = (1/N)Σ(xᵢ - x̂ᵢ)² 或 BCE 公式。
- 嚴禁出現任何過頁鉤子文字 — 頁尾「→ 對抗生成 GAN 見 P13b」整段刪除。
- 頁首導論橫幅內也不要寫「② 生成對抗網路 GAN（P13b，對抗生成）」這類過頁字樣，改寫為「本節介紹兩種代表性生成式模型：① 自編碼器（重構導向） + ② 生成對抗網路 GAN（對抗生成）」即可。

左上角標示「L23203」。主標題寫「3.（5）生成式模型」，副標寫「① 自編碼器（Autoencoder）」。

【頁首導論橫幅】（細條）
生成式模型核心目標 — 學習訓練數據的底層分佈（Underlying Distribution），不只做預測，更能生成或重構新樣本；本節介紹兩種代表性生成式模型：① 自編碼器（重構導向）+ ② 生成對抗網路 GAN（對抗生成）。

【主視覺 — 占頁面上半】
畫一條由左至右的「沙漏型」流程：高維輸入 → 編碼器（Encoder）→ 潛在空間向量 / 瓶頸層（Bottleneck Layer）（畫成中央最窄處）→ 解碼器（Decoder）→ 重構輸出；訓練目標：最小化重構誤差（Reconstruction Error）— 用文字描述「常用均方誤差（MSE）連續資料 / 二元交叉熵 二元資料」。

【頁面下半切兩格】
- 左格 優點 / 應用四個小圈 — ①降維 ②特徵學習 ③數據去噪（去噪自編碼器） ④異常偵測
- 右格 限制 — 重構而非生成「新」數據、潛在空間缺乏結構、生成品質有限

【絕對不要畫】
- 頁尾任何過頁鉤子文字

版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。
```

---

## C7. P13b 重生

**舊檔保留**：`L23203_p13b_sec3_5_gan.png`
**新檔名**：`L23203_p13b_sec3_5_gan_v2.png`

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字（「← Autoencoder」「→ 第 4 章 主流框架」「見 P13a」「見 P14」全部刪除）。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

教材原詞必須清楚出現：生成對抗網路（Generative Adversarial Network, GAN）、生成器（Generator）、判別器（Discriminator）、零和博弈（Zero-Sum Game）、隨機噪聲向量（Latent Vector）、高斯分佈、欺騙、二元分類器、納什均衡（Nash Equilibrium）、生成高品質數據、學習複雜分佈、無需顯示概率密度函數、訓練不穩定性（Training Instability）、模式崩潰（Mode Collapse）、超參數敏感、量化評估困難、Inception Score、FID、真實圖像生成、人臉、數據增強、圖像到圖像轉換、風格遷移、圖像修復、超解析度重建（Super-Resolution）、黑白圖像上色、跨模態生成。

【TERMS_RULE 覆寫】
不要改寫為其他英文術語，不要省略教材括號中的英文詞。
- 教材主詞「生成對抗網路」「生成器」「判別器」「零和博弈」「模式崩潰」「納什均衡」必須保留。
- 隨機噪聲向量可附 z ~ N(0, I) 視覺裝飾（屬合理推論，教材原文寫「高斯分佈」）。
- 嚴禁出現任何過頁鉤子文字 — 頁尾「← Autoencoder 見 P13a；→ 第 4 章 主流框架 見 P14」整段刪除。

左上角標示「L23203」。主標題寫「3.（5）生成式模型」，副標寫「② 生成對抗網路（GAN）」。

【頁首導論橫幅】（細條）
與 Autoencoder 重構導向不同，GAN 透過「兩個網路對抗博弈」直接學習生成全新樣本；2014 年由 Ian Goodfellow 提出後成為生成式 AI 革命起點。

【主視覺 — 占頁面上半】
畫零和博弈（Zero-Sum Game）對抗示意圖：
- 左側 生成器（Generator）— 接收隨機噪聲向量（Latent Vector，高斯分佈採樣，可標 z ~ N(0, I)）→ 生成假樣本；目標：欺騙判別器。
- 右側 判別器（Discriminator）— 接收真實數據與生成假數據混合 → 二元分類器（判真/判假）；目標：抓出生成器的假貨。
- 中央以一條雙向對抗箭頭連接兩者，標出「對抗 / 互相學習 → 直到納什均衡（Nash Equilibrium）」。

【版面下半切左右兩格】
- 左格 優點 — ①生成高品質數據 ②學習複雜分佈 ③無需顯示概率密度函數；下方 缺點 — 訓練不穩定性（Training Instability）、模式崩潰（Mode Collapse）、超參數敏感、量化評估困難（常用指標 Inception Score / FID）
- 右格 適用情境四個小卡 — ①真實圖像生成（人臉/動物/風景/藝術）；②數據增強；③圖像到圖像轉換（風格遷移 / 圖像修復 / 超解析度重建 Super-Resolution / 黑白圖像上色）；④跨模態生成

【絕對不要畫】
- 頁尾任何過頁鉤子文字

版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。
```

---

# D 組 — P18 答案序列（暫緩 TBD，等欣梅爾回來確認）

> **Heiter 暫緩**：原本要重生的 P18_v4 牽涉到「題目選項是否要改」這個超出我權限的決定。
> v3 失敗的根因是「答案序列」與「逐字題目選項」對位衝突，要解決這個衝突有兩條路：
>  - 路線 A：只重生答案順序，題目選項保持不變（v3 圖出了 C/B/B/D/A/C/C/C/B/C 已是模型認知最一致的對位，改答案順序 = 改選項位置 = 改題目）
>  - 路線 B：重新出題（更動 Q1–Q10 的選項排列方式以使正解 = 鎖定的 C/B/C/D/B/B/C/C/B/C）
> **本次 D1 不動，留待欣梅爾回來拍板路線。A 組 / B 組 / C 組 12 張先跑**。

## ~~D1. P18 重生｜模擬考題十宮格~~（暫緩）

**舊檔保留**：`L23203_p18_quiz_questions_v2.png` + `L23203_p18_quiz_questions_v3.png`（兩張都保留）
**新檔名**：`L23203_p18_quiz_questions_v4.png`

**動因**：v3 圖選項對位產出 C/B/B/D/A/C/C/C/B/C，預期是 C/B/C/D/B/B/C/C/B/C。原因是 HANDOFF 內「答案序列」與「逐字題目選項」對位衝突，模型照題目選項生成。本次必須**先把題目選項與答案表一致化**再送 codex。

**送 codex 的完整 prompt**：

```
【共通負向約束】
1. 嚴禁畫成 L23302「模型選擇與架構設計」章節 — 本章是 L23203，左上 L-code 寫「L23203」。
2. 嚴禁出現任何過頁鉤子文字。
3. 嚴禁出現右上角頁碼。

請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。

【TERMS_RULE 覆寫 — 答案序列鎖死】
本頁是模擬考題十宮格（10 題），題目+四選項+正解必須**逐字按下方表格**呈現，不可改寫。請先在心裡核對「我畫的選項順序是否使正解 = 表格鎖定的正解」，再下筆。

| 題號 | 題幹 | (A) | (B) | (C) | (D) | 正解 |
|---|---|---|---|---|---|---|
| Q1 | 下列何者不是深度學習在處理複雜任務上相較於傳統機器學習的優勢？ | 自動學習數據中的高階抽象特徵 | 多層神經網路結構 | 不需要任何計算資源 | 提升影像辨識、語音處理表現 | (C) |
| Q2 | 下列何者最能描述「人工神經元」的核心運作？ | 隨機輸出值 | 對輸入訊號加權求和後通過激活函數產生輸出 | 直接複製輸入 | 永遠輸出 0 或 1 | (B) |
| Q3 | 激活函數的主要角色不包含下列何者？ | 引入非線性 | 決定神經元的「激活」狀態 | 取代損失函數計算誤差 | 壓縮輸出範圍 | (C) |
| Q4 | 下列何種損失函數適用於迴歸問題（預測連續值）？ | 二元交叉熵 | 類別交叉熵 | Softmax 函數 | 均方誤差（MSE） | (D) |
| Q5 | 下列何者**不是**教材列出的常見正則化技術？ | L1 正則化 | 資料增強 | Dropout | 早停法（Early Stopping） | (B) |
| Q6 | 在訓練過程中，「優化器」的目標是？ | 增加損失函數值 | 將損失函數值最小化 | 改變激活函數 | 增加神經元數量 | (B) |
| Q7 | CNN 的核心組件不包含下列何者？ | 卷積層 | 池化層 | 全連接層 | 遞迴連接層 | (D) — 注意：請把 (C) 寫「全連接層」、(D) 寫「遞迴連接層」，正解 (D) |
| Q8 | RNN 訓練時主要使用哪一種反向傳播？ | 標準反向傳播 | Bayesian 反向傳播 | 時間上的反向傳播（BPTT） | 神經反向傳播 | (C) |
| Q9 | Transformer 解決了 RNN/LSTM 的哪兩大痛點？ | 圖像辨識能力不足 | 長期依賴問題 + 並行化困難 | 模型參數過少 | 損失函數無法收斂 | (B) |
| Q10 | 下列何者**不是**教材列出的主流深度學習框架？ | TensorFlow | PyTorch | Caffe2 | JAX | (C) |

說明：
- 上表 10 題的正解順序為：C / B / C / D / B / B / D / C / B / C
- 圖上請以十宮格方式呈現 10 個題目，每格內含「題號 + 題幹 + (A) (B) (C) (D) 四個選項」，**正解標記不需顯示在題目頁**（正解頁是另一張 P19）
- 不要在本頁顯示正解，只要把題目和四個選項按上表逐字寫出
- 排版：5 列 x 2 欄，或 2 列 x 5 欄都可以；題號用手繪圓圈
- 標題：模擬考題（10 題）

左上角標示「L23203」。主標題寫「模擬考題（深度學習原理與框架）」。
```

**注意**：原本 v2/v3 版 Q4 第四題選項對位（A）Logistic Regression / (B) Decision Tree Regression / (C) Random Forest / (D) Support Vector Regression 是 v1 校稿失敗 P18_v2 修復過的問題。本次 v4 重做題目，題目改為「下列何種損失函數適用於迴歸問題」，正解 (D) MSE。如果欣梅爾覺得這 Q4 改題目不妥可以再討論。

---

# 自驗報告檢核點（艾冉跑完回報三件事）

1. **本批 12 張 _v2/_v3 是否全到位**（檔名一字不差）：
   - `L23203_p02_sec2_basic_concepts_overview_v3.png`
   - `L23203_p06_sec2_4_loss_optimizer_v2.png`
   - `L23203_p07_sec2_5_overfitting_regularization_v2.png`
   - `L23203_p10a_sec3_2_cnn_structure_v2.png`
   - `L23203_p10b_sec3_2_cnn_evolution_v2.png`
   - `L23203_p11a_sec3_3_rnn_structure_v2.png`
   - `L23203_p11b_sec3_3_rnn_variants_v2.png`
   - `L23203_p12a_sec3_4_transformer_overview_v2.png`
   - `L23203_p12b_sec3_4_transformer_components_v2.png`
   - `L23203_p12c_sec3_4_transformer_variants_v2.png`
   - `L23203_p13a_sec3_5_autoencoder_v2.png`
   - `L23203_p13b_sec3_5_gan_v2.png`
   - ~~`L23203_p18_quiz_questions_v4.png`~~（本批暫緩，待欣梅爾確認題目選項路線）

2. **原圖完全保留**（v1/v2/v3 一張都沒被覆蓋）

3. **三個關鍵 fix 是否生效**：
   - (a) **P02 ④小卡沒寫「梯度下降法」**（只能寫「最佳化器（Optimizer）」）
   - (b) **P06 MSE 沒寫敏感度描述、MAE 寫了「對極端值（離群值）的敏感度較低」、交叉熵主敘用「距離」、二元/類別交叉熵敘述照教材原文逐字、沒有 BCE/CCE 公式**
   - (c) **P07「噪音與特有模式」只在「模型過於複雜」底下，沒跑到「訓練時間過長」**
   - (d) **P10a 有「運作原理」+「適用情境」獨立小卡、沒有「核心機制」、沒有卷積運算公式 y=ΣΣx·k、沒有「層次化特徵抽取」**
   - (e) **P10b 沒有右下「小註」區塊、沒有頁尾過頁鉤子**
   - (f) **C 組 7 張頁尾都沒有「見 PXX」這類過頁鉤子文字**

4. **風險張**：你覺得有風險的張數列表 + 簡短原因

---

# 工作分配建議

可開 3 個 worker 並行（共 12 張，D 組 P18 暫緩）：
- **Worker 1**（A 組 4 張）：P02_v3 / P06_v2 / P07_v2 / P10a_v2 — 結構性修正，最費工
- **Worker 2**（B 組 1 張 + C 組 4 張）：P10b_v2 / P11a_v2 / P11b_v2 / P12a_v2 / P12b_v2
- **Worker 3**（C 組 3 張）：P12c_v2 / P13a_v2 / P13b_v2

預估總時程：30–40 min（並行）

---

**Heiter 派工 done。**