# L23101 機率統計之機器學習基礎應用 — 模擬試題 30 題

> 題型：四選一單選題（iPAS AI 規劃師中級 標準題型）
> 教材來源：`chunks/L23101.txt`（每題解析末標 chunks 行號）
> 命題原則：用易混淆概念設計干擾項（同類項換位、屬性錯配、定義 partial swap），對應「找混淆」提示詞。

---

## 第一部分｜前言與條件機率分佈概念（Q1–Q3）

### Q1
教材指出機器學習模型核心任務的本質為何？
- (A) 尋找絕對規則與唯一解
- (B) 處理資料中不可避免的「不確定性」，並在此基礎上進行合理的預測與決策
- (C) 透過資料壓縮降低運算成本
- (D) 將所有特徵正規化至 [0, 1] 區間

**答案：(B)**
解析：機器學習模型的核心任務並非僅在於尋找絕對規則，而是要能處理資料中不可避免的「不確定性」，並在此基礎上進行合理的預測與決策。這正是機率與統計在機器學習中扮演關鍵角色的原因。（chunks line 9）

---

### Q2
關於條件機率分佈（Conditional Probability Distribution）`P(Y|X)` 在機器學習中的兩種意涵，下列何者**錯誤**？
- (A) 預測導向：模型輸出為某結果的機率（如分類機率），而非確定性分類結果
- (B) 不確定性評估：機率反映了模型對預測的信心程度，有助於風險控制與決策制定
- (C) X 為輸入特徵（Feature）、Y 為目標變數（Label）
- (D) `P(Y|X)` 僅適用於連續型變數的密度估計，不適用於分類任務

**答案：(D)**
解析：條件機率分佈 `P(Y|X)` 廣泛用於分類（離散 Y）、迴歸（連續 Y）等任務；分類機率即為其典型應用之一。(A)(B)(C) 均為教材列示。（chunks line 15–20）

---

### Q3
教材指出機率分佈在模型設計中扮演的角色為何？
- (A) 僅作為視覺化工具
- (B) 代表對「資料生成機制」的先驗假設，會影響模型選擇與參數學習方式
- (C) 用於計算模型訓練時間
- (D) 僅在資料前處理階段使用，與模型本身無關

**答案：(B)**
解析：選用的機率分佈代表對資料生成機制的先驗假設。例如邏輯迴歸假設目標變數服從伯努利分佈、線性迴歸假設誤差項符合常態分佈、變分自編碼器將潛在變數分佈納入模型核心。（chunks line 22、70）

---

## 第二部分｜離散型與連續型機率分佈（Q4–Q11）

### Q4
下列關於離散型隨機變數的敘述，何者**錯誤**？
- (A) 取值是有限或可數的
- (B) 例如擲骰子的結果（1、2、3、4、5、6）
- (C) 可使用機率密度函數（PDF）描述其特定取值的機率
- (D) 透過機率質量函數（PMF）描述每一個特定取值的機率

**答案：(C)**
解析：離散型用 PMF（機率質量函數），連續型才用 PDF（機率密度函數）。題目把兩者刻意對調為高頻干擾。（chunks line 26–32、52–54）

---

### Q5
關於機率質量函數（Probability Mass Function, PMF），下列敘述何者**正確**？
- (A) PMF 描述連續型隨機變數於某取值範圍內的機率
- (B) PMF 的所有取值機率總和等於 1
- (C) PMF 在單一點的機率為零
- (D) PMF 需透過積分計算區間內的機率

**答案：(B)**
解析：PMF 總和等於 1（`∑ P(X=xᵢ)=1`）。(A)(C)(D) 為 PDF 的特性，題目刻意把 PMF/PDF 屬性錯配。（chunks line 32–38）

---

### Q6
下列離散型機率分佈與其典型應用情境的配對，何者**錯誤**？
- (A) 伯努利分佈（Bernoulli）— 表示具兩種可能結果的事件（如成功/失敗），常見於二元分類任務
- (B) 二項分佈（Binomial）— n 次獨立試驗中某事件發生的次數，模擬多次伯努利事件的累計行為
- (C) 泊松分佈(Poisson)— 描述事件發生「之間的間隔時間」，具備無記憶性
- (D) 泊松分佈(Poisson)— 描述固定時間或空間區間中某事件發生的次數，常用於模擬稀有事件

**答案：(C)**
解析：泊松描述「發生次數」（如單位時間客服來電數），不是「間隔時間」。間隔時間是指數分佈（Exponential）的定義，且無記憶性是指數分佈的特性。教材常將泊松與指數對調作為干擾。（chunks line 42–44、67）

---

### Q7
關於機率密度函數（Probability Density Function, PDF），下列敘述何者**錯誤**？
- (A) 描述隨機變數「於某取值範圍內的機率」
- (B) 透過積分計算區間內的機率：`P(a≤X≤b) = ∫ₐᵇ f(x) dx`
- (C) `f(x)` 為連續型隨機變數的機率密度函數
- (D) PDF 在單一點的取值即為該點發生的確切機率

**答案：(D)**
解析：連續型隨機變數在「單一點」的機率為零；PDF 的單點值是密度（density），不是機率本身，必須對區間做積分才得到機率。（chunks line 52–60）

---

### Q8
下列連續型機率分佈與其特性的配對，何者**錯誤**？
- (A) 常態分佈（Normal）— 對稱的鐘型分佈，廣泛應用於誤差建模、參數估計、特徵分數標準化與生成模型
- (B) 均勻分佈（Uniform）— 表示在某個固定區間內，所有數值具有相同的發生機率，常用於初始化參數或隨機抽樣
- (C) 指數分佈（Exponential）— 描述事件之間的「間隔時間」，具備無記憶性（Memoryless）
- (D) 卡方分佈（Chi-square）— 主要用於描述等待時間或生存時間

**答案：(D)**
解析：「等待時間／生存時間」是指數分佈的應用。卡方分佈用於描述一組獨立標準常態分佈變數「平方和」的分佈結果，廣泛應用於變異數分析、卡方適合度檢定、列聯表獨立性檢定。題目刻意把指數與卡方應用情境對調。（chunks line 65–68）

---

### Q9
邏輯迴歸（Logistic Regression）模型在處理二元分類問題時，通常假設目標變數服從何種分佈？
- (A) 常態分佈
- (B) 均勻分佈
- (C) 伯努利分佈
- (D) 泊松分佈

**答案：(C)**
解析：邏輯迴歸假設目標變數為二元型態（0 或 1），服從伯努利分佈。線性迴歸才是假設誤差項服從常態分佈。（chunks line 70）

---

### Q10
下列模型與其機率分佈假設的配對，何者**錯誤**？
- (A) 邏輯迴歸 — 目標變數服從伯努利分佈，用以處理二元分類問題
- (B) 線性迴歸 — 誤差項符合常態分佈，藉此推導參數估計與檢定的統計性質
- (C) 變分自編碼器（Variational Autoencoder, VAE）— 將潛在變數與觀察變數的分佈型態納入模型架構核心
- (D) 線性迴歸 — 假設目標變數服從伯努利分佈以處理二元分類

**答案：(D)**
解析：「目標變數服從伯努利分佈」是邏輯迴歸（二元分類）的假設；線性迴歸的假設是「誤差項服從常態分佈」。題目把兩個模型的假設前提互相對調是經典干擾。（chunks line 70）

---

### Q11
教材列舉的離散型機率分佈**不包含**下列何者？
- (A) 伯努利分佈（Bernoulli）
- (B) 二項分佈（Binomial）
- (C) 泊松分佈（Poisson）
- (D) 卡方分佈（Chi-square）

**答案：(D)**
解析：卡方分佈為連續型機率分佈（與常態、均勻、指數同類）。離散三大典型 = Bernoulli / Binomial / Poisson。（chunks line 42–44、65–68）

---

## 第三部分｜條件機率與貝氏推論（Q12–Q18）

### Q12
條件機率（Conditional Probability）的數學定義為何？
- (A) `P(A|B) = P(A) × P(B)`
- (B) `P(A|B) = P(A∩B) / P(B)`
- (C) `P(A|B) = P(A) + P(B) − P(A∩B)`
- (D) `P(A|B) = P(B) / P(A∩B)`

**答案：(B)**
解析：條件機率定義為 `P(A|B) = P(A∩B)/P(B)`，表示在事件 B 發生的前提下，事件 A 發生的機率。（chunks line 78–82）

---

### Q13
下列何者**並非**教材所列條件機率在機器學習中的應用場景？
- (A) 分類任務中的條件預測（如邏輯迴歸、貝氏分類器以 `P(Y|X)` 為核心）
- (B) 生醫與金融風控領域的風險預測（如罹病風險、違約機率）
- (C) 生成模型中的變數關聯建構（如變分自編碼器、隱馬可夫模型 HMM）
- (D) 強化式學習中的動作選擇策略

**答案：(D)**
解析：教材列三大應用：分類任務的條件預測、生醫/金融風險預測、生成模型的變數關聯。強化式學習的策略屬於另一範式，不在條件機率章節討論。（chunks line 86–88）

---

### Q14
貝氏定理（Bayes' Theorem）的數學形式為何？
- (A) `P(A|B) = P(B|A) × P(A) / P(B)`
- (B) `P(A|B) = P(A) × P(B) / P(B|A)`
- (C) `P(A|B) = P(A∩B) × P(B)`
- (D) `P(A|B) = P(A) − P(B) + P(B|A)`

**答案：(A)**
解析:貝氏定理 `P(A|B) = P(B|A) · P(A) / P(B)`，表示在事件 B 已發生的情況下，重新評估事件 A 發生機率。（chunks line 96–98）

---

### Q15
下列關於貝氏定理四元素的配對，何者**錯誤**？
- (A) `P(A)` — 先驗機率（Prior Probability），尚未觀察事件 B 之前對事件 A 的初始信念
- (B) `P(B|A)` — 似然（Likelihood），事件 A 發生前提下，事件 B 發生的可能性
- (C) `P(B)` — 邊際機率（Marginal Probability），事件 B 發生的總體機率
- (D) `P(A|B)` — 邊際機率（Marginal Probability），事件 B 發生時 A 的總體機率

**答案：(D)**
解析：`P(A|B)` 為「後驗機率（Posterior Probability）」，是貝氏定理的核心輸出，代表觀察 B 之後對 A 機率的重新估計。題目把 Posterior 跟 Marginal 對調為高頻干擾。（chunks line 102–118）

---

### Q16
教材所述「後驗機率（Posterior Probability）」的意涵為何？
- (A) 在尚未觀察任何資料前，對事件發生的初始信念
- (B) 在觀察到事件 B 之後，根據新的資訊更新後，對事件 A 發生機率的重新估計
- (C) 事件 B 發生的總體機率
- (D) 事件 A 與事件 B 同時發生的聯合機率

**答案：(B)**
解析：後驗機率 = 觀察新事件 B 後，對 A 發生機率的重新估計。這是貝氏定理的核心輸出。(A) 是先驗、(C) 是邊際機率、(D) 是聯合機率。（chunks line 114–118）

---

### Q17
貝氏定理的關鍵意涵為何？
- (A) 計算事件之間互斥關係的工具
- (B) 將「原有知識」與「新資料觀察」整合起來，產生即時的後驗機率調整，使模型在面對不確定性與資料稀疏時保有推論彈性與解釋力
- (C) 取代條件機率定義的等價公式
- (D) 限定僅適用於離散型隨機變數的推論方法

**答案：(B)**
解析：貝氏定理關鍵 = 整合「原有知識（先驗）」與「新資料觀察（似然）」並產生後驗更新，使模型在不確定性與資料稀疏問題中保有推論彈性。（chunks line 120）

---

### Q18
下列關於「似然（Likelihood）」與「邊際機率（Marginal Probability）」的敘述，何者**錯誤**？
- (A) 似然 `P(B|A)` 是在事件 A 發生的前提下，事件 B 發生的可能性
- (B) 邊際機率 `P(B)` 是事件 B 發生的總體機率
- (C) 邊際機率可視為所有可能 A 條件下 B 發生機率的加權總和
- (D) 似然與邊際機率為同一概念的不同稱呼，在貝氏公式中可互換

**答案：(D)**
解析：似然 = `P(B|A)`（條件機率）；邊際機率 = `P(B)`（無論 A 是否發生，B 發生的整體可能性）。兩者意義完全不同，不可互換。（chunks line 106–112）

---

## 第四部分｜假設檢定與統計推論（Q19–Q24）

### Q19
教材所述「統計推論（Statistical Inference）」的核心任務為何？
- (A) 直接最小化模型損失函數
- (B) 利用樣本資料對母體參數或模型行為進行估計與判斷，並量化不確定性
- (C) 將高維資料降至低維表示
- (D) 找出資料中所有可能的特徵組合

**答案：(B)**
解析：統計推論的核心 = 利用樣本資料對母體參數或模型行為進行估計與判斷，並量化不確定性。（chunks line 128）

---

### Q20
下列關於統計推論「參數估計」與「假設檢定」的配對，何者**錯誤**？
- (A) 參數估計 — 推測母體參數的「值」或「區間」
- (B) 假設檢定 — 驗證某個關於母體參數的「主張」是否成立
- (C) 參數估計 — 提供點估計值（如平均數）與信賴區間（如 95% CI）
- (D) 參數估計 — 提供 p 值、檢定統計量，並根據顯著水準決定是否拒絕虛無假設

**答案：(D)**
解析：「p 值、檢定統計量、顯著水準」是「假設檢定」的輸出結果；參數估計的輸出是「點估計值與信賴區間」。題目把兩者輸出對調是經典干擾。（chunks line 130–132）

---

### Q21
教材所列假設檢定的整體流程順序為何？
- (A) 設定虛無假設與對立假設 → 選擇檢定方法與檢定統計量 → 決定顯著水準 → 計算檢定統計量與 p 值 → 比較顯著水準並進行決策
- (B) 計算檢定統計量與 p 值 → 設定虛無假設 → 選擇檢定方法 → 決定顯著水準 → 進行決策
- (C) 決定顯著水準 → 計算 p 值 → 設定虛無假設 → 選擇檢定方法 → 進行決策
- (D) 選擇檢定方法 → 設定虛無假設 → 計算 p 值 → 決定顯著水準 → 進行決策

**答案：(A)**
解析：教材列流程 = A. 設定虛無假設與對立假設 → B. 選擇檢定方法與檢定統計量 → C. 決定顯著水準 → D. 計算檢定統計量與 p 值 → E. 比較顯著水準（α）並進行決策。（chunks line 136–143）

---

### Q22
關於顯著水準（α）的敘述，下列何者**正確**？
- (A) α 表示型二錯誤（Type II Error）發生的機率
- (B) α 是研究者於假設檢定前預先設定的可接受錯誤機率上限，代表型一錯誤（Type I Error）的機率
- (C) α 越大代表檢定越嚴格
- (D) α 與 p 值為同一指標的不同稱呼

**答案：(B)**
解析：顯著水準（α）= 在虛無假設為真的前提下，仍可能因樣本隨機波動而錯誤地拒絕該假設的機率，即型一錯誤（Type I Error）的機率上限。（chunks line 147）

---

### Q23
教材所述 p 值的意義為何？
- (A) 在虛無假設為真的前提下，型一錯誤發生的機率上限
- (B) 在觀察到樣本資料後所計算出的機率，用來衡量資料與虛無假設的相符程度
- (C) 模型預測準確率的指標
- (D) 母體參數的點估計值

**答案：(B)**
解析：p 值是「觀察到樣本資料後所計算出的機率，衡量資料與虛無假設的相符程度」。(A) 是顯著水準 α 的定義（題目刻意 swap）。（chunks line 149）

---

### Q24
下列關於統計推論的敘述，何者**錯誤**？
- (A) 統計推論可協助判斷某特徵是否與目標變數顯著相關
- (B) 統計推論可協助評估兩種模型的表現差異是否具有統計意義
- (C) 假設檢定為統計推論的常用工具之一
- (D) 統計推論不需依賴機率模型即可進行

**答案：(D)**
解析：教材明指「參數估計與假設檢定均依賴機率模型作為推論依據，並對樣本中的不確定性進行量化處理」，統計推論本質就是依賴機率模型。（chunks line 130）

---

## 第五部分｜統計量與機器學習中的應用（Q25–Q30）

### Q25
下列關於統計量（Statistical Measures）在機器學習中應用階段的敘述，何者**錯誤**？
- (A) 統計量廣泛應用於機器學習各階段
- (B) 從前期的資料探索與特徵工程，到後期的模型訓練與效能評估皆使用
- (C) 在資料前處理與探索階段有助於確認變數的分佈型態與異常狀況
- (D) 統計量僅適用於模型部署階段，與訓練無關

**答案：(D)**
解析：統計量「廣泛應用於機器學習各階段，從前期的資料探索與特徵工程，到後期的模型訓練與效能評估」，並非只限於部署階段。（chunks line 153–155）

---

### Q26
下列統計量與其意義的配對，何者**錯誤**？
- (A) 期望值（Expected Value）— 反映變數的平均趨勢，為許多模型的預測基準與參數估計核心
- (B) 變異數（Variance）與標準差（Standard Deviation）— 衡量資料的離散程度
- (C) 偏態（Skewness）— 觀察資料是否具有尖峰或厚尾
- (D) 峰度（Kurtosis）— 觀察資料是否具有尖峰或厚尾，亦可作為偵測異常值密度與風險擴散的參考指標

**答案：(C)**
解析：偏態（Skewness）是「判斷分佈是否對稱」，若偏態過大常需對變數進行對數轉換或 Box-Cox 轉換；「尖峰／厚尾」是峰度（Kurtosis）的觀察重點。題目把兩個統計量的意義對調。（chunks line 159–160）

---

### Q27
教材建議在「偏態過大」的情況下，常採取哪一類處理方式以改善模型收斂性與預測穩定性？
- (A) 主成分分析（PCA）降維
- (B) 對數轉換或 Box-Cox 轉換
- (C) 增加訓練樣本數
- (D) 改用分類損失函數

**答案：(B)**
解析：偏態（Skewness）過大時，常需對變數進行對數轉換或 Box-Cox 轉換，以改善模型收斂性與預測穩定性。（chunks line 159）

---

### Q28
教材所述「變異數與標準差」對特徵工程的指引為何？
- (A) 用於判斷類別變數的分佈型態
- (B) 衡量資料的離散程度，能判斷特徵是否需進行標準化處理，避免尺度不一致對模型訓練造成偏誤
- (C) 用於決定模型損失函數的選擇
- (D) 用於判斷分佈是否對稱

**答案：(B)**
解析：變異數與標準差衡量離散程度，協助判斷特徵是否需標準化處理，避免尺度不一致造成訓練偏誤。「判斷分佈對稱性」是偏態（Skewness）的任務。（chunks line 158）

---

### Q29
教材所述用以「視覺化輔助解釋」統計量的圖形**不包含**下列何者？
- (A) 直方圖
- (B) 箱型圖
- (C) QQ-plot
- (D) ROC 曲線

**答案：(D)**
解析：教材列三種視覺化方式 = 直方圖／箱型圖／QQ-plot；ROC 曲線屬於分類模型評估視覺化，與統計量探索無關。（chunks line 162）

---

### Q30
下列關於 L23101 機率統計章節重點的敘述，何者**錯誤**？
- (A) 機器學習可形式化為條件機率分佈 `P(Y|X)` 的學習問題
- (B) 邏輯迴歸假設目標變數服從伯努利分佈；線性迴歸假設誤差項符合常態分佈
- (C) 貝氏定理可整合先驗信念與新資料觀察，產生後驗更新
- (D) 顯著水準（α）為觀察到樣本資料後所計算出的機率，用以衡量資料與虛無假設相符程度

**答案：(D)**
解析：(D) 是「p 值」的定義；顯著水準（α）是「假設檢定前預先設定的型一錯誤機率上限」。兩者順序與意義不同，常被互換為干擾項。(A)(B)(C) 皆與章節敘述一致。（chunks line 15、70、120、147–149）

---

## 答案速查表

| Q | 答 | Q | 答 | Q | 答 |
|---|---|---|---|---|---|
| 1 | B | 11 | D | 21 | A |
| 2 | D | 12 | B | 22 | B |
| 3 | B | 13 | D | 23 | B |
| 4 | C | 14 | A | 24 | D |
| 5 | B | 15 | D | 25 | D |
| 6 | C | 16 | B | 26 | C |
| 7 | D | 17 | B | 27 | B |
| 8 | D | 18 | D | 28 | B |
| 9 | C | 19 | B | 29 | D |
| 10 | D | 20 | D | 30 | D |

## 命題分布統計

| 章節 | 題號範圍 | 題數 | 重點 |
|---|---|---:|---|
| 前言／條件機率分佈 | Q1–Q3 | 3 | 不確定性、`P(Y|X)` 意涵、機率分佈為先驗假設 |
| 離散／連續機率分佈 | Q4–Q11 | 8 | PMF/PDF、離散分佈三典型、連續分佈四典型、模型分佈假設 |
| 條件機率與貝氏推論 | Q12–Q18 | 7 | 條件機率定義、貝氏定理四元素、先驗/似然/邊際/後驗 |
| 假設檢定與統計推論 | Q19–Q24 | 6 | 統計推論定義、參數估計 vs 假設檢定、流程、α 與 p 值 |
| 統計量與應用 | Q25–Q30 | 6 | 期望值/變異數/偏態/峰度、偏態轉換、視覺化工具、章節整合 |
| **合計** | — | **30** | — |

## 易混淆考點清單（找混淆提示詞輸出）

| # | 易混淆對 | 差異 |
|---|---|---|
| 1 | PMF vs PDF | PMF 描述離散型「特定取值」機率；PDF 描述連續型「區間」機率，單點機率為零（Q4/Q5/Q7） |
| 2 | 泊松 vs 指數分佈 | 泊松描述「發生次數」（離散）；指數描述「間隔時間」（連續，無記憶性）（Q6/Q8） |
| 3 | 卡方 vs 指數應用 | 卡方=平方和分佈、統計檢定；指數=等待時間/生存時間（Q8） |
| 4 | 邏輯迴歸 vs 線性迴歸分佈假設 | 邏輯迴歸假設目標變數服從伯努利；線性迴歸假設誤差項服從常態（Q9/Q10/Q30） |
| 5 | 先驗 vs 後驗機率 | 先驗 `P(A)` = 觀察前的初始信念；後驗 `P(A|B)` = 觀察 B 後的更新（Q15/Q16） |
| 6 | 似然 vs 邊際機率 | 似然 `P(B|A)` = 條件機率；邊際 `P(B)` = 整體可能性（Q15/Q18） |
| 7 | 參數估計 vs 假設檢定輸出 | 參數估計→點估計值與信賴區間；假設檢定→p 值與檢定統計量（Q20） |
| 8 | 顯著水準 α vs p 值 | α=檢定前預設的型一錯誤上限；p 值=觀察樣本後計算的機率（Q22/Q23/Q30） |
| 9 | 偏態 vs 峰度 | 偏態=分佈是否對稱；峰度=尖峰或厚尾、異常值密度（Q26） |
| 10 | 變異數/標準差 vs 偏態 | 變異數/標準差衡量離散程度、決定是否標準化；偏態判斷對稱性、決定是否做對數轉換（Q26/Q28） |

---

— 命題：Heiter（2026-05-12）
— 對應章節：L23101 機率統計之機器學習基礎應用（chunks 共 162 行）