# L23202 常見機器學習演算法 — 模擬試題 30 題

> 題型：四選一單選題（iPAS AI 規劃師中級 標準題型）
> 教材來源：`chunks/L23202.txt`（每題解析末標 chunks 行號）
> 視覺輔助：`output3/L23202_常見機器學習演算法v2/images/` 投影片
> 命題原則：用易混淆概念設計干擾項（同類項換位、屬性錯配、定義 partial swap）

---

## 第一部分｜前言與章節導覽（Q1）

### Q1
下列關於機器學習演算法核心任務的敘述，何者**正確**？
- (A) 學習一個從輸入特徵映射至目標結果的規則，並具備良好的泛化能力
- (B) 完全記憶訓練資料中所有樣本的目標值
- (C) 不需要泛化能力，只要在訓練集上表現好
- (D) 僅處理離散型類別預測

**答案：(A)**
解析：機器學習核心任務為「學習映射規則 + 泛化能力」，不只訓練集表現要好，更要在新資料上維持效能。（chunks line 9）

---

## 第二部分｜監督式學習-迴歸任務（Q2–Q9）

### Q2
下列何者**並非**線性迴歸的「模型假設」？
- (A) 線性關係（Linearity）
- (B) 誤差常態分佈（Normality of Errors）
- (C) 無多重共線性（No Multicollinearity）
- (D) 預測值與實際值必須完全相等

**答案：(D)**
解析：線性迴歸 5 大假設 = 線性關係/誤差常態/變異數齊一/誤差獨立/無多重共線性；模型本身允許誤差項 ε，不要求預測與實際完全相等。（chunks line 60–80）

---

### Q3
下列關於 Lasso 迴歸（L1 正則化）的敘述，何者**正確**？
- (A) 只能限制係數大小，無法將係數壓縮為零
- (B) 在損失函數加入 L2 範數懲罰項
- (C) 在損失函數加入 L1 範數（係數絕對值和）懲罰項，能將部分係數直接壓縮為零，達到特徵選擇效果
- (D) 適合用於資料完全沒有多重共線性的情境

**答案：(C)**
解析：Lasso = L1 正則化 (Σ|βⱼ|)，能將不重要係數壓為 0 達到特徵選擇；(A)(B) 是 Ridge 的特性，搞反了。（chunks line 114–119、127–130）

---

### Q4
下列關於 Ridge 迴歸（嶺迴歸）的敘述，何者**錯誤**？
- (A) 在損失函數加入 L2 正則化（係數平方和）
- (B) 特別適合多重共線性嚴重的情況
- (C) 會將部分係數壓縮為零，達到自動特徵選擇
- (D) 防止模型產生過大的係數

**答案：(C)**
解析：Ridge **不會**將係數壓縮為零，無法自動特徵選擇 — 這是 Lasso 的特點。常見干擾：把 L1 跟 L2 特性互換。（chunks line 120–123、197–201）

---

### Q5
SVR（Support Vector Regression）與傳統線性迴歸最主要的**差異**為何？
- (A) SVR 追求最小化所有資料點的平方誤差總和
- (B) SVR 設定 ε-tube 容忍範圍，忽略誤差小於 ε 的資料點，僅關注超過 ε 的誤差
- (C) SVR 必須假設誤差服從常態分佈
- (D) SVR 無法搭配核函數處理非線性問題

**答案：(B)**
解析：SVR 核心 = ε-tube 概念，提升對離群值的抵抗力；(A)(C)(D) 都是線性迴歸特性 / SVR 反例。（chunks line 213–214、252–258）

---

### Q6
決策樹迴歸（Decision Tree Regressor）在葉節點上的預測值**通常**為何？
- (A) 該葉節點內所有樣本目標值的最大值
- (B) 該葉節點內所有樣本目標值的中位數
- (C) 該葉節點內所有樣本目標值的平均值
- (D) 隨機選一個樣本作為預測值

**答案：(C)**
解析：決策樹迴歸葉節點預測值 = 該節點內所有樣本目標值的**平均值**（教材 line 308「將落在該節點的所有樣本的目標值取平均」）。（chunks line 294、308–312）

---

### Q7
下列關於隨機森林迴歸（Random Forest Regressor）的敘述，何者**錯誤**？
- (A) 每棵樹都在不同的 Bootstrap 隨機子樣本上訓練
- (B) 每次分裂節點時，只隨機選取部分特徵進行考慮
- (C) 最終預測結果是所有樹預測值的中位數
- (D) 抗過擬合能力強，可計算特徵重要性

**答案：(C)**
解析：RF Regressor 最終預測 = 所有樹預測值的**平均值**（不是中位數）；分類 RF 才用投票多數決。（chunks line 363、981–987）

---

### Q8
下列關於梯度提升迴歸（Gradient Boosting Regressor）的敘述，何者**正確**？
- (A) 多棵樹並行訓練，最後取平均
- (B) 序列式集成：每棵新樹專門學習修正前一棵樹的殘差，最終加總多棵弱學習器
- (C) 不需要設定學習率
- (D) 無法搭配 Early Stopping 機制

**答案：(B)**
解析：GBR 核心 = 序列式「逐步修正誤差」；(A) 是 Random Forest 的並行特性；GBR 對學習率與樹深超敏感，需仔細調參。（chunks line 382–393）

---

### Q9
下列關於 XGBoost 與 LightGBM **分裂策略**的差異，何者**正確**？
- (A) 兩者都採用 Leaf-wise 葉子式生長策略
- (B) 兩者都採用 Level-wise 層級式生長策略
- (C) XGBoost 採 Level-wise（橫向擴展，同一深度所有葉子一起分裂）；LightGBM 採 Leaf-wise（縱向，優先分裂增益最大的葉子）
- (D) XGBoost 採 Leaf-wise；LightGBM 採 Level-wise

**答案：(C)**
解析：XGBoost = Level-wise（同層所有葉子一起分裂）；LightGBM = Leaf-wise（優先分裂 max gain 葉子，深而不平衡）。是 XGBoost vs LightGBM 最常考的差異。（chunks line 422–432、1051–1056）

---

## 第三部分｜監督式學習-分類任務（Q10–Q21）

### Q10
邏輯迴歸（Logistic Regression）雖名為「迴歸」，實際上用於解決何種問題？
- (A) 連續數值預測（迴歸）
- (B) 分類問題，尤其適合二元分類（Binary Classification）
- (C) 分群（Clustering）
- (D) 降維

**答案：(B)**
解析：Logistic Regression 名為「迴歸」但實際上是分類演算法，輸出機率 p 透過 sigmoid 函數映射到 [0,1]，特別適合二元分類。（chunks line 506）

---

### Q11
邏輯迴歸的「線性可分性」假設，是針對何者與特徵之間的線性關係？
- (A) 目標變數 y 與特徵之間
- (B) 預測機率 p 與特徵之間
- (C) 對數勝率（Log-Odds）與特徵之間
- (D) 殘差與特徵之間

**答案：(C)**
解析：Logistic Regression 的「線性可分性」= 對數勝率（Log-Odds，即 ln(p/(1-p))）與特徵之間呈線性關係。常見混淆：以為是 p 直接跟特徵線性，但 p 與特徵透過 sigmoid 非線性映射。（chunks line 546–551）

---

### Q12
支援向量機（SVM）的核心思想為何？
- (A) 在特徵空間中尋找一條最能區分不同類別的決策邊界（超平面），並**最大化**兩類之間的間隔（Margin）
- (B) 將所有資料點記入模型，依距離投票決定類別
- (C) 透過機率分佈計算後驗機率，選擇機率最大的類別
- (D) 將特徵映射到 2D 空間後視覺化分類

**答案：(A)**
解析：SVM = 找最大 Margin 超平面 → 提升對未知資料的泛化能力；(B) 是 KNN，(C) 是 Naive Bayes，(D) 是 t-SNE。（chunks line 593–594）

---

### Q13
SVM 處理**非線性**分類問題的關鍵技術為何？
- (A) 增加訓練資料量
- (B) 透過核函數（Kernel Function）將資料映射到更高維度空間，使其可被線性分隔
- (C) 縮減特徵維度
- (D) 提高學習率

**答案：(B)**
解析：SVM 用 Kernel Trick 把資料投射到高維空間使其線性可分；常見核函數 = Linear / Polynomial / RBF / Sigmoid。（chunks line 596、650–655）

---

### Q14
下列何者**並非**決策樹分類器在節點分裂時用於評估的指標？
- (A) 基尼不純度（Gini Impurity）
- (B) 資訊增益（Information Gain，基於熵 Entropy）
- (C) 分類誤差（Classification Error）
- (D) 平均絕對誤差（MAE）

**答案：(D)**
解析：MAE 是迴歸指標；分類決策樹用 Gini / Information Gain / Classification Error 評估節點純度。（chunks line 706–717）

---

### Q15
下列關於決策樹分類器**缺點**的敘述，何者**錯誤**？
- (A) 容易過擬合，單棵樹易學到雜訊
- (B) 對資料微小變動敏感，整棵樹結構可能大幅改變
- (C) 對連續變數產生平滑的決策邊界
- (D) 預測精度通常不如集成方法（如隨機森林或梯度提升樹）

**答案：(C)**
解析：決策樹對連續變數產生「**階梯狀**」決策邊界（分段常數），不是平滑曲線 — 這是其「模型不連續」的特性。（chunks line 738–744）

---

### Q16
關於 KNN（K 最近鄰）的特徵縮放（如標準化或歸一化），下列敘述何者**正確**？
- (A) KNN 對特徵尺度不敏感，不需要縮放
- (B) 不同尺度的特徵會影響距離計算，特徵尺度大者影響力被過度放大，因此通常需要標準化
- (C) 特徵縮放會降低 KNN 預測準確度
- (D) KNN 預測階段不涉及距離計算，無需縮放

**答案：(B)**
解析：KNN 基於距離計算，特徵尺度大者會主導距離 → 必須做特徵縮放避免偏差。常見干擾項。（chunks line 783–786、829–831）

---

### Q17
下列何者**為** KNN 在高維資料表現不佳的主因？
- (A) KNN 需要長時間訓練
- (B) 維度詛咒 — 高維空間中資料點之間距離變得均勻，「最近鄰居」概念失去意義
- (C) KNN 只能處理數值型特徵
- (D) KNN 無法處理多類別分類

**答案：(B)**
解析：維度詛咒（Curse of Dimensionality）= 高維下所有點距離趨於相等，KNN 失效。(A) KNN 是惰性學習，訓練快；(C)(D) 都是錯誤敘述。（chunks line 787–789、825–827）

---

### Q18
樸素貝氏分類器（Naïve Bayes Classifier）「樸素」一詞的**核心假設**為何？
- (A) 假設特徵之間在給定類別的情況下彼此**條件獨立**
- (B) 假設所有類別的先驗機率相同
- (C) 假設特徵與目標完全線性相關
- (D) 假設訓練資料完全沒有雜訊

**答案：(A)**
解析：「樸素」= 特徵條件獨立性假設 P(X|C) = P(x₁|C) × P(x₂|C) × ... × P(xₙ|C)。即便現實中很少完全成立，這個簡化讓計算高效。（chunks line 837–839、862–868）

---

### Q19
下列關於 Bagging 與 Boosting 兩大集成策略的差異，何者**錯誤**？
- (A) Bagging 隨機抽樣建立多個獨立模型，最終結果採多數決或平均
- (B) Bagging 重點在降低**變異性（Variance）**，代表演算法 Random Forest
- (C) Boosting 並行訓練多個獨立模型，互不影響
- (D) Boosting 逐步建立一系列模型，每個新模型修正前一個的錯誤，重點在降低**偏差（Bias）**

**答案：(C)**
解析：Boosting 是**序列式**（每棵新樹修正前棵錯誤），不是並行訓練。Bagging 才是並行獨立訓練。常見混淆考點。（chunks line 932–944）

---

### Q20
集成式分類器在最終決定類別時，**通常**採用哪種機制？
- (A) 取所有基模型預測類別的平均值
- (B) 多數決投票（Voting）或加權投票，或機率平均
- (C) 隨機選取一個基模型的預測作為最終結果
- (D) 取最後訓練那棵樹的預測結果

**答案：(B)**
解析：集成分類用多數決投票（Voting）或加權投票；機率輸出時可用機率平均。Random Forest 用多數決，Gradient Boosting 用加權整合 + Softmax。（chunks line 950–957、981–987）

---

### Q21
下列關於 XGBoost 的技術特點，何者**錯誤**？
- (A) 使用二階導數資訊（Hessian）加速最佳分裂點搜尋
- (B) 支援稀疏資料結構與缺失值自動處理
- (C) 內建防止過擬合的正則化機制（L1、L2）
- (D) 採用 Leaf-wise 葉子式生長策略，優先分裂增益最大的葉子

**答案：(D)**
解析：(D) 是 **LightGBM** 的特點；XGBoost 採用 **Level-wise** 層級式生長（同層所有葉子一起分裂）。常見干擾項。（chunks line 421–426、1047–1053）

---

## 第四部分｜非監督式學習（Q22–Q30）

### Q22
k-means 分群演算法的標準流程**順序**為何？
- (A) 初始化質心 → 重複迭代 → 分配資料點 → 更新質心
- (B) 初始化質心 → 分配資料點 → 更新質心 → 重複至質心不再顯著移動
- (C) 分配資料點 → 初始化質心 → 更新質心 → 重複迭代
- (D) 計算所有點兩兩距離 → 選 K 個最遠 → 分群

**答案：(B)**
解析：k-means 4 步驟 = ①初始化（隨機選 K 個質心）→ ②分配（資料點到最近質心的群集）→ ③更新（重算每群平均當新質心）→ ④重複至收斂。（chunks line 1097–1113）

---

### Q23
下列關於 k-means 的**限制**，何者**錯誤**？
- (A) 需要預先指定 K 值
- (B) 對初始質心的選擇敏感
- (C) 對離群值敏感
- (D) 能形成任意形狀的群集，包括月牙形、環形等不規則形狀

**答案：(D)**
解析：k-means 只能形成**球形或凸形**群集，無法處理不規則形狀（如月牙形、環形）— 這要用 DBSCAN。常見混淆。（chunks line 1121–1129）

---

### Q24
關於階層式分群（Hierarchical Clustering），下列敘述何者**正確**？
- (A) 凝聚式（Agglomerative）= 由上而下（top-down），從一個大群集逐步分裂
- (B) 凝聚式（Agglomerative）= 由下而上（bottom-up），從每個點獨立群集開始逐步合併
- (C) 分裂式（Divisive）= 由下而上（bottom-up）
- (D) 階層式分群需要預先指定 K 值

**答案：(B)**
解析：Agglomerative = bottom-up（合併）；Divisive = top-down（分裂）。階層式不需指定 K（這是相對 k-means 的優勢）。常見混淆：bottom-up vs top-down 對調。（chunks line 1139–1148、1152）

---

### Q25
下列關於 DBSCAN 的**優點**，何者**錯誤**？
- (A) 無需預先指定群集數量
- (B) 能發現任意形狀的群集，不受凸性限制
- (C) 能有效辨識並標記噪聲點（離群值）
- (D) 對密度不均勻的群集處理效果優於 k-means

**答案：(D)**
解析：DBSCAN 處理「密度不均勻」群集效果**不佳**，這是其限制；(A)(B)(C) 才是優點。常見干擾項把「優點/缺點」對調。（chunks line 1185–1194）

---

### Q26
DBSCAN 的兩個**關鍵參數**為何？
- (A) K（群集數量）與初始質心位置
- (B) 學習率（Learning Rate）與正則化係數 λ
- (C) Eps（鄰域半徑）與 MinPts（形成核心群集的最小點數）
- (D) C（懲罰參數）與 γ（核函數參數）

**答案：(C)**
解析：DBSCAN 雙參數 = Eps（鄰域半徑）+ MinPts（最小核心點數）；(A) 是 k-means；(B) 是模型訓練超參；(D) 是 SVM。（chunks line 1172–1179）

---

### Q27
關於主成分分析（PCA）的特性，下列敘述何者**錯誤**？
- (A) 是一種線性降維方法，透過正交變換投影到新座標軸
- (B) 每個主成分代表數據中最大的變異量方向
- (C) 能有效捕捉非線性結構的數據關係
- (D) 對離群值敏感，因為離群值會顯著影響協方差矩陣計算

**答案：(C)**
解析：PCA 是**線性**降維，**只能捕捉線性關係**，對非線性結構效果不佳 — 這也是 t-SNE/UMAP 出現的理由。常見干擾項。（chunks line 1203–1207、1239–1245）

---

### Q28
下列關於 t-SNE 的敘述，何者**正確**？
- (A) 是一種線性降維方法，類似 PCA
- (B) 非線性降維方法，專為高維數據的視覺化設計，能保留局部結構呈現複雜群集結構
- (C) 計算效率高，適合處理數百萬樣本的大資料集
- (D) 結果完全 deterministic，每次運行結果都相同

**答案：(B)**
解析：t-SNE = 非線性 + 視覺化專用 + 保留局部結構。(A) 錯（PCA 才是線性）；(C) 錯（t-SNE 計算成本高，通常限數萬樣本）；(D) 錯（受隨機初始化影響）。（chunks line 1251–1278）

---

### Q29
Apriori 演算法的**核心性質**為何？
- (A) 若一個項集是頻繁的，則其所有非空子集也一定頻繁；反之，若一個項集不頻繁，包含它的任何超集也一定不頻繁
- (B) 必須掃描資料集 N 次才能找出所有頻繁項集（N = 項目總數）
- (C) 不能用於關聯規則挖掘，只能用於分群
- (D) 構建 FP 樹結構從中遞歸挖掘頻繁項目集

**答案：(A)**
解析：Apriori 性質 = 不頻繁項集的所有超集也不頻繁 → 大幅減少搜尋空間。(D) 是 FP-Growth 的特性（比 Apriori 更高效）。（chunks line 1330–1334、1375–1380）

---

### Q30
關於 Isolation Forest（孤立森林）異常偵測的**核心思想**，下列敘述何者**正確**？
- (A) 異常點在 iTree 中通常具有**較短的路徑長度**（很快就被孤立），路徑越短越可能是異常
- (B) 異常點具有較長的路徑長度，難以被孤立
- (C) 需要計算所有點兩兩之間的距離才能判斷異常
- (D) 只能用於低維資料，不適合處理高維數據

**答案：(A)**
解析：Isolation Forest 觀察 = 異常點少且與正常點距離遠，**只需少量分割就能孤立** → 路徑越短越異常。(C) 錯（不需距離計算）；(D) 錯（高效適合高維資料）。（chunks line 1427–1453）

---

## 答案速查表

| Q | 答 | Q | 答 | Q | 答 |
|---|---|---|---|---|---|
| 1 | A | 11 | C | 21 | D |
| 2 | D | 12 | A | 22 | B |
| 3 | C | 13 | B | 23 | D |
| 4 | C | 14 | D | 24 | B |
| 5 | B | 15 | C | 25 | D |
| 6 | C | 16 | B | 26 | C |
| 7 | C | 17 | B | 27 | C |
| 8 | B | 18 | A | 28 | B |
| 9 | C | 19 | C | 29 | A |
| 10 | B | 20 | B | 30 | A |

## 命題分布統計

| 章節 | 題號 | 題數 | 重點 |
|---|---|---:|---|
| 前言／章節導覽 | Q1 | 1 | ML 演算法核心任務 |
| 監督式-迴歸 | Q2–Q9 | 8 | 線性/Lasso vs Ridge/SVR/決策樹/RF/GBR/XGBoost vs LightGBM |
| 監督式-分類 | Q10–Q21 | 12 | LR/SVM/Kernel/DT 純度指標/KNN/Naive Bayes/Bagging vs Boosting/集成投票 |
| 非監督式 | Q22–Q30 | 9 | k-means/階層式/DBSCAN/PCA/t-SNE/Apriori/Isolation Forest |
| **合計** | — | **30** | — |

## 易混淆考點清單（找混淆提示詞輸出）

| # | 易混淆對 | 差異 |
|---|---|---|
| 1 | Lasso（L1）vs Ridge（L2） | Lasso 壓零做特徵選擇；Ridge 只限制大小（Q3/Q4） |
| 2 | XGBoost vs LightGBM 分裂策略 | XGBoost Level-wise（橫向）；LightGBM Leaf-wise（縱向）（Q9/Q21） |
| 3 | Random Forest vs Gradient Boosting | RF 並行+多數決；GBR 序列+殘差學習（Q7/Q8/Q19） |
| 4 | Bagging vs Boosting | Bagging 降變異 並行；Boosting 降偏差 序列（Q19） |
| 5 | LR 的「線性」對象 | 不是 p 跟特徵線性，而是 Log-Odds 跟特徵線性（Q11） |
| 6 | k-means vs DBSCAN | k-means 需 K + 球形；DBSCAN 不需 K + 任意形狀（Q23/Q25/Q26） |
| 7 | 階層式 Agglomerative vs Divisive | Agg = bottom-up；Div = top-down（Q24） |
| 8 | PCA vs t-SNE | PCA 線性 + 通用；t-SNE 非線性 + 視覺化專用（Q27/Q28） |
| 9 | 決策樹分裂指標 vs 迴歸指標 | 分類用 Gini/IG/Class Error；迴歸用 MAE/MSE/R²（Q14） |
| 10 | Isolation Forest 路徑長度 | 異常點路徑短（容易被孤立），不是長（Q30） |

---

— 命題：Heiter（2026-05-12）
— 對應投影片版本：L23202v2 章節完整版（含 P07a/P07b/P07c 迴歸集成、P14a/P14b/P14c 分類集成、P16a/P16b/P16c 分群、P17a/P17b 降維）
