# L23302 模型選擇與架構設計 — 模擬試題 30 題

> 題型：四選一單選題（iPAS AI 規劃師中級 標準題型）
> 教材來源：`chunks/L23302.txt`（每題解析末標 chunks 行號）
> 視覺輔助：`output3/L23302_模型選擇與架構設計/images/` 投影片
> 命題原則：用易混淆概念設計干擾項（同類項換位、屬性錯配、定義 partial swap）

---

## 第一部分｜前言與模型選擇原則（Q1–Q4）

### Q1
下列關於模型選擇（Model Selection）**核心目的**的敘述，何者**正確**？
- (A) 模型選擇只需考慮預測準確率,其他因素不重要
- (B) 模型選擇直接決定後續**訓練成效、泛化能力,以及部署後的可用性與效益**;需兼顧資料特性、任務需求、解釋性與運算資源
- (C) 模型選擇與部署無關
- (D) 模型選擇只考量演算法理論複雜度

**答案：(B)**
解析：教材明確指出模型選擇需兼顧資料特性、任務需求、模型解釋性以及運算資源與部署限制四大面向。常見干擾項以單一面向誘答。（chunks line 13–17）

---

### Q2
下列關於**分類任務（Classification）**的敘述，何者**正確**？
- (A) 目標是預測一個**連續數值**輸出
- (B) 目標是預測資料所屬的**離散類別**;常見情境包括垃圾郵件偵測、疾病診斷、客戶流失預測
- (C) 目標是將資料壓縮為低維表示
- (D) 目標是將資料自動分組,使群內相似、群間差異大

**答案：(B)**
解析：分類 = 預測離散類別。(A) 是迴歸;(C) 是降維;(D) 是聚類。任務類型不可混淆。（chunks line 23–31）

---

### Q3
下列何者**並非**教材中提到的「分類任務常用模型」？
- (A) 決策樹、隨機森林
- (B) 支援向量機（SVM）
- (C) 神經網路（Neural Network）
- (D) **K-means**

**答案：(D)**
解析：K-means 是**聚類（非監督）**演算法,不是分類常用模型;(A)(B)(C) 才是教材列出的分類模型。常見干擾把監督與非監督模型混在分類選項中。（chunks line 33–37、69）

---

### Q4
下列關於**迴歸任務（Regression）**常用模型的敘述，何者**錯誤**？
- (A) 線性迴歸（Linear Regression）簡單且高解釋性,適合線性趨勢明顯的資料
- (B) 決策樹迴歸、隨機森林迴歸對於非線性與特徵交互效果有良好處理能力
- (C) 神經網路適合處理大規模、高維度或非線性強烈的資料情境
- (D) **DBSCAN** 是迴歸任務的常用模型

**答案：(D)**
解析：DBSCAN 是**聚類**演算法,不是迴歸模型;教材列出的迴歸模型 = 線性迴歸 / 決策樹迴歸 / 隨機森林迴歸 / 神經網路。常見干擾項。（chunks line 49–53、71）

---

## 第二部分｜非監督學習與時序任務（Q5–Q9）

### Q5
下列關於**聚類任務（Clustering）**目標與模型的對應，何者**正確**？
- (A) 目標是預測類別;常用模型為 SVM 與邏輯迴歸
- (B) 目標是將資料自動分組,**使群內相似、群間差異大**;K-means 適合資料呈球狀且群數已知時,DBSCAN 適合有噪聲或群大小不均的資料
- (C) 目標是將高維資料降為低維;常用模型為 PCA
- (D) 目標是從序列預測未來;常用模型為 LSTM

**答案：(B)**
解析：聚類 = 群內相似/群間差異大；K-means → 球狀/已知 K;DBSCAN → 有噪聲/群大小不均。常見干擾項把聚類與分類/降維/序列混淆。（chunks line 63–71）

---

### Q6
下列關於**降維任務（Dimensionality Reduction）**及對應模型,何者**正確**？
- (A) PCA 保留最大變異方向,具解釋性;**自編碼器（Autoencoder）** 適合**非線性降維與結構重建**需求
- (B) PCA 是非線性降維方法
- (C) PCA 與自編碼器目標完全相反
- (D) 自編碼器無法用於降維

**答案：(A)**
解析：PCA = 線性降維保留最大變異方向;Autoencoder 透過 Encoder-Decoder 學習潛在表示,可實現非線性降維與結構重建。常見干擾項對調線性/非線性屬性。（chunks line 73–82）

---

### Q7
下列關於**序列與時間序列任務**常用模型的敘述，何者**錯誤**？
- (A) RNN / LSTM / GRU 適合處理長序列記憶與依賴關係
- (B) 時序卷積網路（Temporal Convolutional Network, TCN）對長期依賴具有穩定性
- (C) ARIMA 等統計模型適合短期、週期性明顯且資料量不大之應用
- (D) **K-means** 是時間序列預測的常用模型

**答案：(D)**
解析：K-means 是聚類模型,不是時間序列模型;教材列出的時序模型 = RNN/LSTM/GRU、TCN、ARIMA。常見干擾把非時序模型錯置。（chunks line 84–106）

---

### Q8
下列關於**時序卷積網路（Temporal Convolutional Network, TCN）**的特色，何者**正確**？
- (A) TCN 是 K-means 的時序變種
- (B) TCN **對長期依賴具有穩定性**,屬於序列建模常用模型
- (C) TCN 僅能處理影像資料
- (D) TCN 只能用於分類任務

**答案：(B)**
解析：TCN = 時序卷積網路,對長期依賴穩定;常見干擾項把它的功能搞混到影像或分類。（chunks line 100–102）

---

### Q9
下列關於 **ARIMA 模型**的敘述，何者**正確**？
- (A) ARIMA 屬於深度學習模型
- (B) ARIMA 是**統計模型**,適合**短期、週期性明顯且資料量不大**之應用
- (C) ARIMA 適用於大規模影像資料
- (D) ARIMA 與 LSTM 完全等價

**答案：(B)**
解析：ARIMA 是傳統統計模型,適合短期+週期+小資料時序場景;不是深度學習,也不適合影像。常見干擾項。（chunks line 104–106）

---

## 第三部分｜資料規模與模型選擇（Q10–Q14）

### Q10
下列關於**小型資料集（數百至數千筆樣本）**的模型選擇敘述，何者**正確**？
- (A) 應選擇**結構簡單、參數數量少**的模型(如線性迴歸、邏輯迴歸、決策樹或 Lasso、Ridge 等正則化模型),以降低過擬合風險
- (B) 應直接使用深度神經網路,效果一定最好
- (C) 不需要特徵工程
- (D) 應立即上 GPU 分散式訓練

**答案：(A)**
解析：小資料集應選簡單模型 + 強化特徵工程;深度神經網路在小資料上容易過擬合且難以發揮優勢。常見干擾項以「深度學習萬能」誘答。（chunks line 112–115）

---

### Q11
下列關於**中型資料集（數千至數十萬筆樣本）**的模型選擇敘述，何者**錯誤**？
- (A) 能支持較高表現力的模型如隨機森林、梯度提升機（XGBoost、LightGBM）等
- (B) 可進一步嘗試模型集成與超參數優化,提升預測效能
- (C) 計算資源與訓練時間,會成為實務上必須考量的限制因素
- (D) 必須使用 GPU 分散式訓練,單機完全無法處理

**答案：(D)**
解析：中型資料一般單機 + CPU/GPU 即可處理;教材並未要求必須使用分散式訓練。常見干擾項以絕對化敘述誘答。（chunks line 117–120）

---

### Q12
下列關於**大型資料集（百萬級以上樣本）**的模型選擇敘述，何者**正確**？
- (A) 大規模資料能發揮**深度模型**的表現潛力,特別是在**非結構化資料**（如影像、語音、文字）處理上
- (B) 大型資料只能使用線性模型
- (C) 大型資料不需要 GPU 或分散式架構
- (D) 大型資料訓練不需考量擴展性

**答案：(A)**
解析：大型資料 = 深度神經網路的舞台,尤其在影像/語音/文字等非結構化資料上效果顯著;同時對運算能力、分散式架構、調校效率有更高要求。（chunks line 122–125）

---

### Q13
下列關於資料規模與模型複雜度**關係**的敘述，何者**正確**？
- (A) 資料量與模型複雜度無關
- (B) 資料量越少,越應選擇**簡單**模型以降低過擬合風險;資料量越大,可選擇更複雜的模型發揮表現潛力
- (C) 資料量越少,越應選擇複雜模型
- (D) 資料量越大,反而需要更簡單的模型

**答案：(B)**
解析：「資料量 ↔ 模型複雜度」的標準對應 — 小資料 → 簡單模型(降過擬合);大資料 → 複雜模型(發揮表現)。常見干擾項以反向敘述誘答。（chunks line 110–125）

---

### Q14
下列關於小型資料集**特徵工程重要性**的敘述，何者**正確**？
- (A) 小資料集**不需要**特徵工程
- (B) 小資料集**特徵工程的重要性提高**,需以較強的先驗假設支撐模型效果
- (C) 特徵工程僅在大資料時才有意義
- (D) 特徵工程會降低小資料模型表現

**答案：(B)**
解析：小資料時模型可學的訊號有限,需要透過強特徵工程注入領域知識/先驗假設,彌補資料不足。常見干擾項。（chunks line 115）

---

## 第四部分｜模型解釋性需求（Q15–Q19）

### Q15
下列關於**高解釋性模型**的敘述，何者**正確**？
- (A) 線性迴歸（Linear Regression）、邏輯迴歸（Logistic Regression）與**淺層決策樹**等具備結構簡單、邏輯可視化的特性
- (B) 隨機森林是典型的高解釋性模型
- (C) 深度神經網路是天生高解釋性
- (D) 高解釋性模型完全無法用於分類

**答案：(A)**
解析：高解釋性模型代表 = 線性迴歸 / 邏輯迴歸 / 淺層決策樹;決策過程明確,變數對預測的影響可透過係數、分割規則解釋。常見干擾項。（chunks line 131–135）

---

### Q16
下列何種應用情境**特別強調**模型可解釋性？
- (A) 影像分類比賽
- (B) **醫療診斷、信貸評分、法規監管**等需要追溯模型決策邏輯的場域
- (C) 電玩遊戲 AI
- (D) 純粹的研究實驗

**答案：(B)**
解析：高風險/合規敏感場域（醫療、金融、法遵）對可解釋性有明確要求,需追溯模型決策邏輯。常見干擾項。（chunks line 129–135）

---

### Q17
下列關於**低解釋性模型**搭配可解釋性技術的對應，何者**錯誤**？
- (A) SHAP（SHapley Additive exPlanations）可用於輔助理解模型對特徵的依賴關係
- (B) LIME（Local Interpretable Model-Agnostic Explanations）可用於模型解釋
- (C) 偏依圖（Partial Dependence Plot, PDP）可用於模型解釋
- (D) **One-hot Encoding** 是模型可解釋性技術

**答案：(D)**
解析：One-hot 是**類別資料編碼方法**,不是可解釋性技術;教材列出的可解釋性技術 = SHAP / LIME / PDP。常見干擾項。（chunks line 137–141）

---

### Q18
下列關於隨機森林、梯度提升樹與深度神經網路的**解釋性特性**敘述，何者**正確**？
- (A) 都屬於高解釋性模型
- (B) 雖具備高度預測能力,但結構**高度非線性且包含大量參數**,使得模型的決策過程**不易直觀理解**
- (C) 解釋性比線性迴歸還高
- (D) 完全無法被解釋

**答案：(B)**
解析：教材定義這三類為「低解釋性模型」,雖然效能強,但決策過程黑箱化,建議搭配 SHAP/LIME/PDP 輔助理解。常見干擾項。（chunks line 137–141）

---

### Q19
下列關於**淺層決策樹（Shallow Decision Tree）**為何屬高解釋性模型的敘述，何者**正確**？
- (A) 因為其結構簡單,分割規則可視化,使用者能直接看懂決策路徑
- (B) 因為其權重數量極多
- (C) 因為其完全等同於深度神經網路
- (D) 因為它無法做任何預測

**答案：(A)**
解析：淺層決策樹由少量分裂節點構成,每個 split 規則可視化,使用者能逐步追溯決策路徑,因此屬高解釋性。常見干擾項。（chunks line 131–133）

---

## 第五部分｜運算資源、部署限制與偏差變異權衡（Q20–Q30）

### Q20
下列關於**資源受限場景（如 IoT、手機 App、邊緣裝置）**的模型選擇敘述，何者**正確**？
- (A) 適合選用**模型結構簡單、參數少、推論快速**的演算法,例如簡單決策樹、邏輯迴歸或經壓縮後的小型神經網路
- (B) 應直接使用最大型的深度模型發揮效能
- (C) 不需要考慮模型大小
- (D) 完全不能使用任何神經網路

**答案：(A)**
解析：資源受限場景需要小、快、輕的模型;亦可使用模型剪枝（Pruning）或量化（Quantization）等技術瘦身。常見干擾項以絕對化敘述誘答。（chunks line 147–149）

---

### Q21
下列哪一個技術**並非**用於模型瘦身（適合邊緣部署）？
- (A) 模型剪枝（Model Pruning）
- (B) 模型量化（Quantization）
- (C) 知識蒸餾（Knowledge Distillation）
- (D) **資料增強（Data Augmentation）**

**答案：(D)**
解析：資料增強是用於擴充訓練資料的方法,不是壓縮模型大小的技術;(A)(B)(C) 才是模型瘦身常見手段。常見干擾項。（chunks line 149、157）

---

### Q22
下列關於**即時推論需求**情境的考量，何者**正確**？
- (A) 即時推論不需考量延遲
- (B) 在必須秒級或毫秒級回應的任務中(如金融交易、推薦系統),須優先考量模型的**推論延遲與效能表現**,可搭配 caching、模型蒸餾（knowledge distillation）等技術提升即時表現
- (C) 即時推論只能用最複雜的模型
- (D) 即時推論完全等同於資源受限場景

**答案：(B)**
解析：即時推論強調延遲控制,常見搭配技術 = caching + 模型蒸餾(把大模型知識濃縮到小模型);與資源受限有重疊但不完全相同(資料中心也可能要即時)。（chunks line 155–158）

---

### Q23
下列關於**偏差（Bias）**的敘述，何者**正確**？
- (A) Bias 指模型對訓練資料雜訊過於敏感
- (B) Bias 指模型**對資料結構的擬合能力不足**,無法有效捕捉資料中的主要趨勢,導致系統性誤差偏高（**欠擬合**）
- (C) Bias 與模型複雜度完全無關
- (D) Bias 越高,泛化能力越好

**答案：(B)**
解析：Bias 高 = 欠擬合(under-fitting),模型太簡單捕捉不到趨勢。常見干擾項把 Bias 與 Variance 角色對調。（chunks line 175–179）

---

### Q24
下列關於**變異（Variance）**的敘述，何者**正確**？
- (A) Variance 指模型擬合能力不足
- (B) Variance 指模型**對訓練資料的細微差異或雜訊過於敏感**,導致模型在不同資料集上的表現差異大、**泛化能力差**（過擬合）
- (C) Variance 越高,模型一定越好
- (D) Variance 完全等同於 Bias

**答案：(B)**
解析：Variance 高 = 過擬合(over-fitting),模型太複雜學到雜訊;Bias = 欠擬合;兩者經常被互換考。（chunks line 181–183）

---

### Q25
下列關於**模型複雜度與 Bias/Variance 的關係**敘述，何者**正確**？
- (A) 模型複雜度提升通常伴隨**偏差降低與變異提高**,因此需在二者之間取得平衡
- (B) 模型越複雜,偏差越高
- (C) 模型越複雜,變異越低
- (D) Bias 與 Variance 永遠同向變動

**答案：(A)**
解析：偏差-變異權衡的核心 — 複雜度↑ → Bias↓ + Variance↑;反之亦然。需在中間找最佳平衡。常見干擾項把方向對調。（chunks line 184–185）

---

### Q26
下列關於**低複雜度模型（如線性迴歸）**的 Bias/Variance 特性，何者**正確**？
- (A) **偏差較高、變異較低**,穩定且具解釋性,但無法處理複雜關係
- (B) 偏差較低、變異較高
- (C) 偏差與變異都極高
- (D) 偏差與變異都極低

**答案：(A)**
解析：低複雜度模型 = 高 Bias + 低 Variance + 穩定 + 解釋性好,但表達力不足。常見干擾項。（chunks line 186–189）

---

### Q27
下列關於**高複雜度模型（如深度神經網路）**的 Bias/Variance 特性，何者**正確**？
- (A) 偏差較高、變異較低
- (B) **偏差低、變異高**,可擬合複雜模式,但需更多資料或額外的正則化方法以控制變異
- (C) 偏差與變異都極高
- (D) 偏差與變異都極低

**答案：(B)**
解析：高複雜度模型 = 低 Bias + 高 Variance,擬合力強但易過擬合,需用更多資料或正則化(L1/L2/Dropout)控制變異。常見干擾項與低複雜度模型敘述對調。（chunks line 190–192）

---

### Q28
下列哪一項**並非**用於減少高複雜度模型 Variance 的方法？
- (A) 增加訓練資料量
- (B) 使用 L1 / L2 正則化
- (C) 使用 Dropout
- (D) **故意增加更多隱藏層使模型更複雜**

**答案：(D)**
解析：增加複雜度反而會放大 Variance,應該反向操作 — 加資料、加正則化、Dropout 才能控制 Variance。常見干擾項。（chunks line 190–192）

---

### Q29
下列關於**模型選擇必須兼顧訓練與部署**的敘述，何者**正確**？
- (A) 模型選擇與部署應**同步規劃**,避免訓練完成後才發現模型無法實際上線執行
- (B) 模型選擇只看訓練效能,部署與選擇無關
- (C) 部署是維運的事,與資料科學家無關
- (D) 訓練完模型就一定能部署,不需提前考量

**答案：(A)**
解析：教材明確指出模型選擇與部署應同步規劃 — 避免做了一個準的模型但跑不上線或推論太慢的尷尬。常見干擾項。（chunks line 159）

---

### Q30
下列關於**任務類型 ↔ 模型配適**的對應，何者**錯誤**？
- (A) 分類 → 決策樹/SVM/神經網路
- (B) 迴歸 → 線性迴歸/決策樹迴歸/神經網路
- (C) 聚類 → K-means / DBSCAN
- (D) **降維 → ARIMA / GRU**

**答案：(D)**
解析：ARIMA 與 GRU 都是**時間序列**模型,不是降維方法;降維對應的是 PCA、自編碼器（Autoencoder）。常見干擾項把時序模型錯置到降維。（chunks line 63–106）

---

## 答案速查表

| Q | 答 | Q | 答 | Q | 答 |
|---|---|---|---|---|---|
| 1 | B | 11 | D | 21 | D |
| 2 | B | 12 | A | 22 | B |
| 3 | D | 13 | B | 23 | B |
| 4 | D | 14 | B | 24 | B |
| 5 | B | 15 | A | 25 | A |
| 6 | A | 16 | B | 26 | A |
| 7 | D | 17 | D | 27 | B |
| 8 | B | 18 | B | 28 | D |
| 9 | B | 19 | A | 29 | A |
| 10 | A | 20 | A | 30 | D |

## 命題分布統計

| 章節 | 題號 | 題數 | 重點 |
|---|---|---:|---|
| 前言與模型選擇原則 | Q1–Q4 | 4 | 模型選擇核心目的、分類/迴歸任務與模型配對 |
| 非監督學習與時序任務 | Q5–Q9 | 5 | 聚類目標、降維 PCA/Autoencoder、時序 RNN/TCN/ARIMA |
| 資料規模與模型選擇 | Q10–Q14 | 5 | 小/中/大資料模型策略、特徵工程在小資料的重要性 |
| 模型解釋性需求 | Q15–Q19 | 5 | 高/低解釋性模型、SHAP/LIME/PDP、應用情境 |
| 運算資源、部署限制與 Bias-Variance | Q20–Q30 | 11 | 邊緣部署、模型瘦身（剪枝/量化/蒸餾）、即時推論、Bias/Variance 定義與權衡、低/高複雜度模型特性 |
| **合計** | — | **30** | — |

## 易混淆考點清單（找混淆提示詞輸出）

| # | 易混淆對 | 差異 |
|---|---|---|
| 1 | 分類 vs 迴歸 vs 聚類 vs 降維 | 離散類別 vs 連續值 vs 自動分群 vs 低維表示（Q2/Q3/Q5/Q6） |
| 2 | K-means vs DBSCAN | 球狀+已知 K vs 噪聲+群大小不均（Q5） |
| 3 | PCA vs Autoencoder | 線性 vs 非線性降維（Q6） |
| 4 | RNN/LSTM/GRU vs TCN vs ARIMA | 深度時序 vs 卷積時序 vs 統計時序（Q7/Q8/Q9） |
| 5 | 小/中/大資料集模型策略 | 簡單→集成→深度（Q10/Q11/Q12/Q13） |
| 6 | 高解釋 vs 低解釋模型 | 線性/邏輯/淺樹 vs RF/GBT/DNN（Q15/Q18） |
| 7 | SHAP / LIME / PDP | 三種低解釋模型的可解釋性輔助技術（Q17） |
| 8 | 模型剪枝/量化/蒸餾 vs 資料增強 | 前三者瘦身;資料增強擴增資料（Q21） |
| 9 | Bias vs Variance | 欠擬合（系統性誤差）vs 過擬合（資料敏感）（Q23/Q24） |
| 10 | 低複雜度 vs 高複雜度模型 Bias/Variance | 高 Bias+低 Variance vs 低 Bias+高 Variance（Q26/Q27） |

---

— 命題：Heiter（2026-05-12）
— 對應投影片版本：L23302 章節完整版（涵蓋模型選擇原則、任務類型配對、資料規模考量、解釋性需求、運算資源限制、偏差-變異權衡）
