# L23203 prompts.md ↔ chunks/L23203.txt 行號對照（output3 版）

本文件記錄 `output3/L23203_深度學習原理與框架/prompts.md` 中每一頁 prompt 對應到 `chunks/L23203.txt` 的行號範圍。

**output3 版的設計原則：章節命名與切頁嚴格沿用 chunks 原文 `#` heading**，每頁 1 對 1 對應一個原始章節（含節導讀 + 各 `（X）` 子小節 + 模擬考題 + 考題解析）。

**本章特性：** chunks 達 1322 行（含模擬考題與解析），是目前科目三學習指引中份量最大的章節。共 5 主章 + 13 個子小節 + 模擬考題 + 考題解析，第一輪交付 19 頁；多個子小節單頁行數遠超 50 行門檻（CNN / RNN / Transformer / 生成式模型），目前不主動拆頁，待生圖驗收後決定。

## 對照表

| Prompt | 主標題 | L23203.txt 行號 | 對應教材小節 |
|---|---|---:|---|
| P01 | 1. 前言與章節導覽 | 5–13 | `# 1.前言與章節導覽` |
| P02 | 2. 深度學習基本概念 | 15 | `# 2.深度學習基本概念` 章節導讀（極短，無正文段落） |
| P03 | 2.（1）人工神經元與感知器概念 | 17–110 | `# （1）人工神經元與感知器概念`（人工神經元 Artificial Neuron + 感知器 Perceptron + 加權求和公式 + 步階函數 + XOR 限制） |
| P04 | 2.（2）激活函數的角色 | 112–149 | `# （2）激活函數的角色`（引入非線性 + 決定激活狀態 + 壓縮輸出範圍 三大功能） |
| P05 | 2.（3）前向傳播與反向傳播原理 | 151–230 | `# （3）前向傳播與反向傳播原理`（前向傳播做預測 / 反向傳播調整參數 / 連鎖律 / 梯度 / 優化器迭代學習） |
| P06 | 2.（4）損失函數與優化器 | 232–266 | `# （4）損失函數與優化器`（MSE/MAE 迴歸；Cross-Entropy/Log Loss 二元/類別交叉熵 分類） |
| P07 | 2.（5）過擬合與正則化技術 | 268–321 | `# （5）過擬合與正則化技術`（過擬合三因 + L1/L2/Elastic Net/Dropout/Early Stopping 五項技術） |
| P08 | 3. 深度學習模型架構 | 323–325 | `# 3.深度學習模型架構` 章節導讀 |
| P09 | 3.（1）多層感知器（Multilayer Perceptron, MLP） | 327–431 | `# （1）多層感知器（Multilayer Perceptron. MLP）`（前饋全連接結構 + 三層架構 + 三種輸出層配置 + 優缺點 + 適用情境） |
| P10 | 3.（2）卷積神經網路（Convolution Neural Network, CNN） | 433–578 | `# （2）卷積神經網路（Convolution Neural Network, CNN）`（卷積層/池化層/全連接層 + 權重共享 + 衍伸 AlexNet→VGG→GoogLeNet→ResNet→DenseNet→MobileNet/EfficientNet） |
| P11 | 3.（3）遞迴神經網路（Recurrent Neural Network, RNN） | 580–710 | `# （3）遞迴神經網路（Recurrent Neural Network, RNN）`（循環連接 + 隱藏狀態 + 展開視角 + BPTT + 梯度消失/爆炸 + 衍伸 LSTM/GRU/Bi-RNN/Deep RNN） |
| P12 | 3.（4）Transformer 架構 | 711–955 | `# （4）Transformer 架構`（Encoder/Decoder + 注意力機制/自注意力 Q/K/V + 多頭注意力 + 位置編碼 + 殘差連接/層歸一化 + 衍伸 BERT/GPT/T5/ViT/長序列 Transformer） |
| P13 | 3.（5）生成式模型 | 956–1126 | `# （5）生成式模型`（自編碼器 Encoder/Decoder/Bottleneck/重構誤差 + GAN 生成器/判別器/零和博弈/納什均衡 + 模式崩潰） |
| P14 | 4. 深度學習主流框架 | 1127–1129 | `# 4.深度學習主流框架` 章節導讀 |
| P15 | 4.（1）TensorFlow 與 Keras | 1131–1171 | `# （1）TensorFlow 與 Keras`（TensorFlow 計算圖/即時執行/跨平台部署/TFX + Keras 極簡主義/模組化/tf.keras） |
| P16 | 4.（2）PyTorch | 1173–1193 | `# （2）PyTorch`（FAIR / 動態計算圖 / Pythonic / Autograd / torchvision/torchtext/torchaudio/PyTorch Lightning/HuggingFace Transformers） |
| P17 | 4.（3）JAX、MXNet、PaddlePaddle 等簡介 | 1195–1209 | `# （3）JAX、MXNet、PaddlePaddle 等簡介`（JAX ML Transformations + MXNet AWS 混合式 + PaddlePaddle 列入標題） |
| P18 | 模擬考題 | 1212–1283 | `# 模擬考題` 10 題單選題卡 |
| P19 | 考題解析 | 1285–1325 | `# 考題解析` 10 題答案 + 解析 |

合計 **19 頁**。

## 注意事項

1. **本地行號 vs PDF 全域行號**：
   - 上表行號為 `chunks/L23203.txt` 內的本地行號（從 1 開始），不是 PDF 全域行號。
   - chunks 檔頭標示「行數範圍：2802–4123」，因此 PDF 全域行號 = 本地行號 + 2801（即起始值 2802 對應本地行 1，所以對齊公式為 `PDF 全域行號 = 2802 + 本地行號 − 1`）。
   - 例：P12 Transformer 本地行 711–955，對應 PDF 全域行 3512–3756。

2. **行號範圍涵蓋率**：
   - 5–1325 行幾乎完整覆蓋（除前 4 行檔頭 metadata）。
   - 各頁行號**連續無斷層**，每一行教材內容都至少屬於一個 prompt。
   - P02 章節導讀只覆蓋第 15 行（chunks 此處只有一個 heading 無正文段落，刻意保留導讀頁以維持「四章導讀對齊」原則）。
   - P14 章節導讀覆蓋 1127–1129 行，其中 1130 行為 `# TensorFlow` 子標但屬於 P15 內容範圍；P15 起始行 1131 仍為 `# TensorFlow` 區塊內容延續，故視為 P15 開始。

3. **密集頁警示（單頁 chunks ≥ 50 行 → 實戰常需拆頁）**：

   | Prompt | 行數 | 密度判斷 | 處理方式 |
   |---|---:|---|---|
   | P03 | 94 行 | **高密度** | prompt 已要求版面分上下兩半（人工神經元 / 感知器） |
   | P05 | 80 行 | **高密度** | prompt 已要求版面切左右兩大區塊（前向傳播 / 反向傳播） |
   | P07 | 54 行 | 中密度 | prompt 已要求版面分上下兩半（過擬合 / 正則化技術 5 項） |
   | P09 | 105 行 | **高密度** | prompt 已要求版面切上下，下半 2×2 四格優缺點 |
   | P10 | 146 行 | **極高密度** | prompt 已要求切上下兩大區塊（結構運作 / 衍伸模型時間軸） |
   | P11 | 131 行 | **極高密度** | prompt 已要求切上下兩大區塊（結構運作 / 衍伸模型 4 卡 + 適用情境） |
   | P12 | 245 行 | **頂級密度** | prompt 已要求切三個橫向大區塊（架構總覽 / 五大模組 / 優缺點+衍伸 5 模型）。**最有可能需要進入第二輪拆頁。** |
   | P13 | 171 行 | **極高密度** | prompt 已要求切上下兩大區塊（自編碼器 / GAN）。**也可能需要拆頁。** |
   | P18 | 72 行 | 中密度 | 10 題用 5×2 兩欄式網格布局 |

   **第二輪拆頁候選清單（按優先順序）**：
   - **P12 Transformer**：頂級密度 245 行，含 Encoder/Decoder 架構 + 五大模組 + 衍伸 5 模型；若實際生圖小字過多，可拆為 P12a（架構 + 五大模組）+ P12b（優缺點 + 衍伸模型 BERT/GPT/T5/ViT/長序列）。
   - **P13 生成式模型**：171 行，自編碼器 + GAN 兩大主題自然可拆為 P13a（自編碼器）+ P13b（GAN）。
   - **P10 CNN**：146 行，可拆為 P10a（卷積層/池化層/全連接層 結構與運作）+ P10b（衍伸模型 AlexNet→...→EfficientNet 時間軸）。
   - **P11 RNN**：131 行，可拆為 P11a（RNN 基本結構 + BPTT + 長期依賴問題）+ P11b（衍伸模型 LSTM/GRU/Bi-RNN/Deep RNN + 適用情境）。
   - 拆頁時主標題仍沿用 chunks 原文，僅以副標標示子主題（沿用 L23102 P11/P12 拆頁的「主標不變、副標分主題」原則）。

4. **與 L23102 標竿差異**：
   - L23102（17 頁）：5 主章 + 9 子小節，僅 4.（2）矩陣分解一頁拆為 P11/P12。
   - L23203（19 頁，本檔）：5 主章 + 13 子小節 + 模擬考題 + 考題解析；**整體密度顯著高於 L23102**，多頁處於密集頁邊界。第一輪不主動拆頁是為了讓使用者先看實際生圖效果，再決定是否進入第二輪拆頁更新（特別是 P12 Transformer）。
   - 模擬考題 + 考題解析在 L23102 chunks 中沒有對應段落；本章末尾完整保留 10 題模擬考 + 解析，獨立成 P18/P19 兩頁。

5. **章節導讀頁（P02/P08/P14）內容偏輕**：
   - P02 對應 chunks 只有第 15 行一行（純 heading 無正文）；P08 對應 323–325（兩段話導引五種架構）；P14 對應 1127–1129（一段話導引三種框架）。
   - 三張導讀頁皆已加上「指向子小節入口」的設計讓版面有東西可呈現。如果嫌導讀頁佔頁數，可合進該章 `（1）` 那頁。

6. **TERMS_RULE 覆寫頁清單**：本章專有名詞密集，多達 14 頁有 inline 覆寫：
   - **P03**（人工神經元 / 感知器 / 步階函數 中文主詞鎖死）
   - **P04**（激活函數 / 引入非線性 / 壓縮輸出範圍 中文主詞鎖死）
   - **P05**（前向傳播 / 反向傳播 / 連鎖律 中文主詞鎖死）
   - **P06**（均方誤差 / 平均絕對誤差 / 交叉熵損失 / 對數損失 中文主詞鎖死）
   - **P07**（L1 正則化 / L2 正則化 / Elastic Net / Dropout / 早停法 名稱完整保留）
   - **P09**（多層感知器 / 前饋 / 全連接 / Softmax 中文主詞鎖死）
   - **P10**（CNN 架構六核心詞 + 衍伸 7 模型 AlexNet/VGG/GoogLeNet/ResNet/DenseNet/MobileNet/EfficientNet 名稱完整保留）
   - **P11**（RNN 三核心詞 + 衍伸 4 模型 LSTM/GRU/Bi-RNN/Deep RNN 全名完整保留）
   - **P12**（Transformer 六核心詞 + Q/K/V 教材原文 + 衍伸 BERT/GPT/T5/ViT/Longformer/Reformer/Performer 名稱完整保留）
   - **P13**（自編碼器 / 生成對抗網路 / 生成器 / 判別器 / 重構誤差 / 模式崩潰 / 納什均衡 中文主詞鎖死）
   - **P14** 主章導讀無覆寫（共用 TERMS_RULE 即可）
   - **P15**（TensorFlow / Keras / 計算圖 / 即時執行 + TFX/TensorFlow Lite/TensorFlow.js/tf.keras 名稱完整保留）
   - **P16**（PyTorch / 動態計算圖 / 自動微分 / Pythonic + torchvision/torchtext/torchaudio/PyTorch Lightning/HuggingFace Transformers 名稱完整保留）
   - **P17**（JAX / MXNet / PaddlePaddle 中文主詞鎖死）

   共 13 頁有 inline 覆寫（P01/P02/P08/P14/P18/P19 共 6 頁僅用共用 TERMS_RULE）。

## 用途

- **校對**：每頁 prompt 是否漏掉教材原詞，照行號回去抓教材原文補。Transformer 章節（P12）術語密度極高，請特別留意 Q/K/V 三向量、多頭注意力、位置編碼、殘差連接、層歸一化等核心詞是否完整出現。
- **擴/減頁決策**：
  - 若 P12 Transformer 生圖小字過密，第二輪拆為 P12a（架構 + 五大模組）+ P12b（優缺點 + 衍伸模型 5 個），其後 P13–P19 依序重編號為 P14–P20，總頁數 19 → 20。
  - 若 P13 生成式模型生圖密度仍過高，可拆為 P13a（自編碼器）+ P13b（GAN），總頁數 +1。
  - 若 CNN/RNN 衍伸模型時間軸不可讀，可參考 L23102 P11/P12 拆頁手法處理。
- **跨章節參考**：之後 L23204+ 章節若涉及深度學習實作或更專門的模型架構，可套同樣的「主章嚴格沿用 chunks heading + 密集子節必要時拆子頁」原則。

— 編表：Heiter（2026-05-05）
