某電商企業希望利用自然語言處理(NLP)技術,分析顧客在社群平 台與商品評論中的文字內容,以即時掌握顧客對產品的滿意度變化。 若採用情感分析(Sentiment Analysis)模型,其主要目的為何?
A預測顧客使用的語言風格與語氣;
B判斷文本中所表達的情感傾向;
C將顧客留言自動翻譯成企業內部指定語言;
D產生顧客評論的自動化摘要內容
✅ 正確答案:(B) 判斷文本中所表達的情感傾向;
某跨國金融科技公司導入 Transformer架構開發多語客服系統,以提 升長篇金融文件的自動翻譯品質。下列何者為該模型能顯著改善翻譯 準確度的主要原因?
A透過自注意力機制(Self-Attention Mechanism)捕捉長距離語 境依賴關係;
B透過卷積運算(Convolution Operation)加速訓練過程;
C透過強化學習(Reinforcement Learning)自動調整語句生成策 略;
D透過資料增強(Data Augmentation)平衡多語語料比例
✅ 正確答案:(A) 透過自注意力機制(Self-Attention Mechanism)捕捉長距離語 境依賴關係;
某企業計畫應用 BERT(Bidirectional Encoder Representations from Transformers)模型分析大量顧客意見,以強化客服自動回覆 系統。在 BERT 的預訓練過程中,「遮罩語言模型(Masked Language Model, MLM)」的主要訓練策略為何?
A依序遮罩句尾詞語,讓模型從左到右逐步生成完整句子;
B隨機遮罩部分詞語,並讓模型根據雙向上下文(Bidirectional Context)預測被遮罩的詞;
C透過對抗訓練(Adversarial Training)生成語意相似的擾動樣 本以提升泛化性;
D以未遮罩的詞為條件,使用解碼器(Decoder)結構重建整句內容
✅ 正確答案:(B) 隨機遮罩部分詞語,並讓模型根據雙向上下文(Bidirectional Context)預測被遮罩的詞;
在詞向量(Word Embedding)訓練方法中,GloVe(Global Vectors for Word Representation)與 Word2Vec的主要差異為何?
AWord2Vec 以詞頻權重訓練詞向量,而 GloVe以隨機初始化向量進 行學習;
BWord2Vec 以全局統計矩陣為基礎,而 GloVe採用神經網路進行上 下文預測;
CWord2Vec 為基於預測的模型,而 GloVe為基於共現統計的模型;
DWord2Vec 僅能用於靜態文本語料,而 GloVe可應用於即時語料更 新
✅ 正確答案:(C) Word2Vec 為基於預測的模型,而 GloVe為基於共現統計的模型;
某企業以詞頻–逆文件頻率(Term Frequency–Inverse Document Frequency, TF-IDF)方法分析顧客意見內容,但發現模型在處理篇 幅較長的回饋文本時,無法準確反映關鍵詞的重要性。下列何者為造 成此現象的主要原因?
A長文本中的詞頻偏高,導致常見詞權重被過度放大;
B長文本中缺乏明確句子邊界,造成 TF-IDF 無法計算詞頻;
CTF-IDF 無法同時處理多份文件;
D長文本會改變 IDF(Inverse Document Frequency)的計算,使所 有詞權重趨於相近
✅ 正確答案:(A) 長文本中的詞頻偏高,導致常見詞權重被過度放大;
某企業嘗試以 N-gram語言模型(N-gram Language Model)建立客服 自動回覆系統,但發現模型生成的句子雖在片段上合理,卻缺乏整體 語意連貫性。此問題最可能源自 N-gram模型的哪一項限制?
AN-gram 模型在訓練過程中需要龐大計算量,導致長句無法收斂;
BN-gram 模型僅根據固定長度的前序詞建立機率估計,難以捕捉長 距離依賴關係(Long-range Dependencies);
CN-gram 模型缺乏語意嵌入(Semantic Embedding)層,因此無法 表徵詞語間的語意相似度;
DN-gram 模型假設詞與詞之間相互獨立,導致無法建構上下文語意 關聯
✅ 正確答案:(B) N-gram 模型僅根據固定長度的前序詞建立機率估計,難以捕捉長 距離依賴關係(Long-range Dependencies);
在企業導入的智慧監控系統中,模型以物件偵測(Object Detection)方式自動辨識影像中的人物與車輛。若評估指標採用平 均精確率(Mean Average Precision, mAP),其中 IoU (Intersection over Union)閾值設定較高時,代表下列哪一項意 義?
A預測邊界框與真實邊界框的重疊程度越高,模型偵測結果越精 準;
B預測邊界框與真實邊界框的誤差越大,導致 mAP數值上升;
C模型整體精確率(Precision)降低,但召回率(Recall)上升;
D預測邊界框的評估結果不受真實框大小影響
✅ 正確答案:(A) 預測邊界框與真實邊界框的重疊程度越高,模型偵測結果越精 準;
關於 Softmax 與 Max-Pooling,下列敘述何者正確?
ASoftmax 與 Max-Pooling都會將特徵張量壓縮為單一最大值;
BMax-Pooling 會對輸入進行機率分佈的轉換;
CSoftmax 會保留所有輸入資訊,但以比例表示;Max-Pooling 只保 留區域最大值;
DSoftmax 主要用於特徵降維,而 Max-Pooling用於分類輸出
✅ 正確答案:(C) Softmax 會保留所有輸入資訊,但以比例表示;Max-Pooling 只保 留區域最大值;
某企業在訓練生成式 AI模型時,導入資料增強(Data Augmentation)技術以擴充訓練資料,但觀察到模型效能反而下降。 下列哪一項最可能的原因與對應改善策略最為正確?
A增強樣本未經隨機初始化,導致模型梯度更新不穩定,應重新設 計訓練啟動流程;
B增強後資料的特徵分佈與原始資料不一致,影響模型的泛化能 力,應檢查並調整增強策略以維持語意一致性;
C增強樣本的比例過高,造成模型對特定資料產生偏好,應適度提 高增強比例並調整學習率;
D增強後資料的標註可信度下降,導致訓練訊號偏差,應以半監督 學習方式重新校正資料
✅ 正確答案:(B) 增強後資料的特徵分佈與原始資料不一致,影響模型的泛化能 力,應檢查並調整增強策略以維持語意一致性;
如果希望同時兼顧「精確率(Precision)」和「召回率(Recall)」, 下列哪一個指標可以作為綜合評估的標準?
A準確率(Accuracy);
B均方根誤差(RMSE);
C均方誤差(MSE);
DF1分數(F1 Score)
✅ 正確答案:(D) F1分數(F1 Score)
企業資料分析團隊使用 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)演算法進行顧客行為分群,並希望模 型能自動區分主要群集與雜訊資料。 在此演算法中,決定聚類結果的兩個主要超參數為下列何者?
A特徵數與學習率;
BK 值與距離閾值;
C鄰域半徑(Epsilon ε)與最小點數(MinPts);
D交叉熵(Cross Entropy)與權重初始化
✅ 正確答案:(C) 鄰域半徑(Epsilon ε)與最小點數(MinPts);
某金融科技公司建立房價預測模型,使用多項特徵(如建坪、房齡、 樓層、總價等)進行線性迴歸分析(Linear Regression Analysis)。資料分析師發現多個特徵之間存在高度相關性,導致模 型係數不穩定、預測誤差上升。為解決此問題,下列哪一種方法最適 合?
A繼續保留所有特徵,不進行任何處理;
B使用主成分分析(PCA)將相關特徵轉換為彼此獨立的主成分;
C新增更多原始變數以提升模型表現;
D改用分類模型進行預測
✅ 正確答案:(B) 使用主成分分析(PCA)將相關特徵轉換為彼此獨立的主成分;
下列何者為 Kubernetes在 AI模型部署與運行中的核心功能?
A自動化管理模型的訓練流程與參數調校;
B管理與協調模型服務的部署、擴展與運行環境;
C提供 AI 模型的資料儲存與版本控管功能;
D負責深度學習推論的 GPU 加速運算
✅ 正確答案:(B) 管理與協調模型服務的部署、擴展與運行環境;
在調整模型超參數(Hyperparameters)時,若希望避免因過度調整 參數而導致過擬合,下列哪一種做法最有效提升模型的泛化能力?
A採用交叉驗證(Cross-Validation)於多組參數組合間反覆評 估,選擇在驗證資料上表現最穩定的設定;
B使用早期停止機制(Early Stopping)監控訓練誤差並在收斂前 停止訓練,以防模型學習過度;
C對輸入特徵進行標準化以減少特徵值差異帶來的過擬合風險;
D提高模型複雜度並使用更多超參數搜尋範圍,以確保模型能充分 學習資料特徵
✅ 正確答案:(A) 採用交叉驗證(Cross-Validation)於多組參數組合間反覆評 估,選擇在驗證資料上表現最穩定的設定;
在企業導入的 MLOps(Machine Learning Operations)流程中, Model Registry 最常用於哪一個階段?
A用於設定運算資源與執行環境以確保訓練穩定;
B用於建立可重複使用的資料與特徵版本;
C用於集中管理模型版本、訓練紀錄與部署狀態;
D用於追蹤模型上線後的表現與漂移情況
✅ 正確答案:(C) 用於集中管理模型版本、訓練紀錄與部署狀態;
下列哪一種情境中最適合使用「序列到序列(Seq2Seq)」模型?
A預測銷售趨勢曲線,輸出未來數值序列;
B辨識文本中出現的人名、地名與組織名稱等實體資訊;
C對輸入文本中的關鍵字進行頻率統計與可視化;
D將輸入文字轉換成語意等價的另一段文字,如自動翻譯或摘要生 成
✅ 正確答案:(D) 將輸入文字轉換成語意等價的另一段文字,如自動翻譯或摘要生 成
在自然語言處理中,檢索增強生成(Retrieval-Augmented Generation, RAG)是一種結合語言模型與向量搜尋的技術,可有效 減少模型知識過時與產生幻覺的問題。若要建立一套高效能的 RAG系 統,下列何者為在「檢索階段」最關鍵的挑戰?
A確保檢索到的文件能被完整納入語言模型的上下文視窗(Context Window)中進行生成;
B選擇使用 Faiss或 ScaNN等近似最近鄰搜尋函式庫;
C降低嵌入模型(Embedding Model)在高維空間中的計算成本與記 憶體占用;
D避免向量檢索結果僅具語意相似但與查詢意圖無實質關聯的情況
✅ 正確答案:(D) 避免向量檢索結果僅具語意相似但與查詢意圖無實質關聯的情況
當 Transformer 模型發生「注意力分布過於平均(Attention Collapse)」的情形時,導致模型無法有效聚焦於關鍵資訊,下列哪 一項策略可有效改善此問題?
A提高 Query-Key點積(Dot Product)的縮放常數;
B在 Softmax 前加入高斯雜訊(Gaussian Noise);
C使用 ReLU 函數取代 Softmax;
D對注意力權重施加稀疏化約束(Sparsity Constraint)
✅ 正確答案:(D) 對注意力權重施加稀疏化約束(Sparsity Constraint)
某研究團隊正在訓練一個針對低資源語言(如少數民族語言)的語言 模型,但該語言僅有約 1萬筆語料可用。在訓練過程中出現明顯的過 擬合現象,若希望在不新增真實語料的前提下提升模型的泛化能力, 採用下列哪一種方法最為適合?
A將 Transformer 的隱藏層維度擴增至 1024,以提升表徵能力;
B採用反向翻譯(Back-Translation)技術,以生成額外目標語句 的偽平行語料(Pseudo‑Parallel Corpus);
C對詞嵌入矩陣(Embedding Matrix),施加 L1正則化以壓縮模型 參數;
D將多語言 BERT(mBERT)中所有 Transformer層全部凍結以保留預 訓練知識
✅ 正確答案:(B) 採用反向翻譯(Back-Translation)技術,以生成額外目標語句 的偽平行語料(Pseudo‑Parallel Corpus);
在使用生成對抗網路(GAN)進行人臉影像生成時,若出現「模式崩 潰」(Mode Collapse)現象,下列哪一種方法最常被用來有效解決此 問題?
A在鑑別器中加入梯度懲罰(Gradient Penalty)以穩定訓練過 程;
B採用 Wasserstein 距離(WGAN 損失)替代原始的 GAN 損失函 數;
C對生成器輸入的潛在向量加入隨機擾動;
D使用多尺度鑑別器架構以提高對多樣性的判別能力
✅ 正確答案:(B) 採用 Wasserstein 距離(WGAN 損失)替代原始的 GAN 損失函 數;
在多模態 AI 模型訓練或推論過程中,遇到某一模態資料缺失(例如 僅有影像資料但缺少文本說明),下列哪一種策略最有效維持模型效 能?
A以零向量或固定向量填充缺失模態輸入;
B訓練具備模態缺失感知能力的模型,使其適應缺失狀況;
C利用生成模型(如 GAN 或自迴歸模型)預測並補全缺失模態資 料;
D直接捨棄缺少模態的樣本,避免干擾訓練或推論
✅ 正確答案:(B) 訓練具備模態缺失感知能力的模型,使其適應缺失狀況;
某電商平台開發的顧客流失預測模型在上線數月後,預測準確率明顯 下降。專案團隊懷疑顧客行為模式改變,導致模型輸入特徵的分佈與 原始訓練資料不同,出現典型的資料漂移(Data Drift)問題。為了 偵測並確認資料分佈是否發生變化,下列哪一種作法最合適?
A定期重新訓練模型以應對外部變化;
B提升模型複雜度以捕捉更多資料變異性;
C增加測試資料量以提高評估準確度;
D計算輸入特徵分佈間的 KL散度(KL Divergence)
✅ 正確答案:(D) 計算輸入特徵分佈間的 KL散度(KL Divergence)
某大型醫院即將部署一套輔助診斷的 AI系統,為降低對臨床流程的 衝擊,同時確保風險可控與回饋可收斂,應採取何種『漸進式部署』 (Phased Rollout)策略最為合適?
A從單一專科(如放射科)或特定病房開始啟用,逐步擴展至全 院;
B先部署於病例量較高的急診單位,加速收集高頻使用回饋;
C僅在夜班或離峰時段啟用,避免影響主要臨床工作負載;
D在使用者界面啟用提示模式,讓全院同步體驗但不影響診斷流程
✅ 正確答案:(A) 從單一專科(如放射科)或特定病房開始啟用,逐步擴展至全 院;
某金融機構的 AI風控系統遭受對抗性攻擊,駭客透過對輸入特徵進 行微小但惡意的擾動,成功欺騙了模型。為了從根本上解決模型自身 對這類攻擊的脆弱性,下列何者並非針對此種攻擊型態的技術手段?
A強化資料前處理,用以過濾掉格式不符或數值極端異常的輸入;
B在模型訓練階段導入對抗樣本訓練,以提升模型對惡意特徵擾動 的辨識與防禦能力;
C於推論後階段使用規則引擎,以確保模型的預測結果不違反既有 的業務硬性規定;
D在模型部署環境中強化網路防火牆,以阻擋來自未授權來源的網 路連線
✅ 正確答案:(D) 在模型部署環境中強化網路防火牆,以阻擋來自未授權來源的網 路連線
某企業部署生成式 AI系統協助行銷與內容產出,但近期遭質疑部分 生成內容可能涉及著作權侵權。為降低企業在法律層面的潛在責任與 風險,下列哪一項策略最能有效預防侵權問題產生?
A對生成內容進行語意相似度比對,自動標註可能涉及既有著作的 輸出結果,以降低侵權風險;
B建立訓練資料篩選與授權驗證機制,排除未授權或高風險資料來 源;
C在訓練與微調過程中採用差分隱私技術,避免模型記憶特定受著 作權保護的樣本;
D在模型輸出端嵌入浮水印(Watermarking)或數位指紋(Digital Fingerprint)技術,以確保生成內容可追溯
✅ 正確答案:(B) 建立訓練資料篩選與授權驗證機制,排除未授權或高風險資料來 源;
在房價預測任務中,若發現特徵如「房間數」與「坪數」存在高度多 重共線性(Multicollinearity),為降低共線性對模型參數估計的負 面影響,應優先選擇下列哪種模型?
A不受多重共線性影響的決策樹模型;
B傳統線性迴歸模型,不含正則化項;
C支持向量機搭配線性核函數;
D含 L1正則化的 LASSO迴歸模型
✅ 正確答案:(D) 含 L1正則化的 LASSO迴歸模型
某企業需分析半結構化的系統日誌(JSON格式),以提取關鍵的時序 特徵供故障預測模型使用。考量日誌結構複雜且包含巢狀欄位 (Nested Fields),下列哪一種策略最有效且實務可行?
A先將 JSON 資料扁平化轉成 CSV,再對欄位計算統計量(如均值、 次數)作為特徵;
B使用遞歸神經網路(RNN)直接輸入原始 JSON字串進行時序特徵 抽取;
C設計遞迴函式展開巢狀欄位,並基於時間窗口(Time Window)進 行聚合與特徵萃取;
D只保留時間戳記欄位,忽略其他巢狀內容以簡化特徵工程
✅ 正確答案:(C) 設計遞迴函式展開巢狀欄位,並基於時間窗口(Time Window)進 行聚合與特徵萃取;
在一個同時包含連續型特徵與類別型特徵的資料集中,若希望透過適 當的特徵工程流程來提升模型整體表現,下列哪一種作法最為合適?
A將類別型特徵使用標籤編碼(Label Encoding)轉換後,與連續 特徵直接合併進行模型訓練;
B將連續特徵進行離散化(Discretization)或分桶(Binning)轉 為類別型特徵,統一以類別方式處理;
C對連續特徵做標準化(Standardization),類別特徵採用目標編 碼(Target Encoding),並生成交互特徵提升模型表現;
D只保留連續特徵,忽略類別型變量以簡化模型 答案 題目
✅ 正確答案:(C) 對連續特徵做標準化(Standardization),類別特徵採用目標編 碼(Target Encoding),並生成交互特徵提升模型表現;
某 AI開發團隊為提升模型開發效率及品質控制,計畫實施持續整合 (Continuous Integration, CI)流程。下列哪一項做法最符合 CI 的核心實踐,且能有效減少整合風險?
A在主分支(Main Branch)每日固定時間手動合併並執行完整測試 流程;
B每次程式碼提交(Commit)後自動觸發建置、單元測試及靜態程 式碼分析;
C於模型訓練完成後,定期安排開發團隊回顧並合併程式碼;
D透過自動化部署腳本,將模型在特定時間點批次釋出到測試環境
✅ 正確答案:(B) 每次程式碼提交(Commit)後自動觸發建置、單元測試及靜態程 式碼分析;
某銀行計劃將 AI詐欺偵測模組整合至核心交易系統,主管機關要求 全流程必須符合金融監管對「不可否認性(Non-repudiation)」的資 訊安全規範,以確保日後能進行法務追蹤與稽核。下列哪一項措施最 能確保此要求的落實?
A為每筆 AI模型推論記錄其輸入與輸出結果的加密雜湊值 (Hash),並簽署數位簽章以確保不可竄改性;
B優化模型效能以降低平均推論延遲至 100ms以下,提升使用者體 驗;
C增加主機備援數量,以確保系統在故障時持續可用;
D將模型推論請求導入負載平衡器,避免單點壅塞導致服務延遲
✅ 正確答案:(A) 為每筆 AI模型推論記錄其輸入與輸出結果的加密雜湊值 (Hash),並簽署數位簽章以確保不可竄改性;
某 AI服務系統每次推論請求需約 1秒完成,且必須支撐高達 10,000 次請求每秒(RPS)的流量。為確保系統具備高可用性且能穩定應付 流量峰值,下列哪一種架構方案最為合適?
A依賴單台超高效能伺服器進行垂直擴展,提升硬體規格;
B採用容器化部署並水平擴展服務實例,結合自動彈性伸縮機制 (Auto Scaling);
C限制最大併發連線數,以避免系統過載;
D增加批次處理大小,一次同時處理上千筆請求
✅ 正確答案:(B) 採用容器化部署並水平擴展服務實例,結合自動彈性伸縮機制 (Auto Scaling);
某企業已將 AI模型部署於生產環境,為確保系統持續穩定運作,並 能提前偵測模型效能可能衰退,技術團隊希望透過監控指標進行預 警。 下列哪一項監控指標最具預測效力,能提早發現模型效能下滑風險?
A系統 CPU 與記憶體使用率波動幅度;
B模型推論結果的置信度(Confidence)分佈變化趨勢;
CAPI平均回應時間與延遲百分位數變化;
D輸入特徵與訓練資料分布差異的 PSI(Population Stability Index)指數
✅ 正確答案:(D) 輸入特徵與訓練資料分布差異的 PSI(Population Stability Index)指數
企業團隊在使用 Word2Vec模型訓練客服文本語料時,若訓練資料量 龐大且希望模型能更有效捕捉罕見詞的語意關聯,下列哪一種訓練策 略最為適合?
A採用 Skip-gram模型,但以隨機初始化權重加快高頻詞的訓練收 斂;
B採用 CBOW 模型(Continuous Bag of Words Model)並結合 TF- IDF權重以強化低頻詞表示;
C採用 Skip-gram模型,利用中心詞預測周圍詞語,能更有效學習 低頻詞關係;
D採用 CBOW 模型(Continuous Bag of Words Model),利用周圍詞 預測中心詞,能提升罕見詞的語意穩定度
✅ 正確答案:(C) 採用 Skip-gram模型,利用中心詞預測周圍詞語,能更有效學習 低頻詞關係;
在自駕車影像辨識系統中,開發團隊希望模型能同時辨識每個像素所 屬的物件類別(例如道路、建築、行人),又能區分出同類物件的不 同個體(例如多位行人)。此時最適合採用下列哪一項電腦視覺技 術?
A語義分割(Semantic Segmentation);
B物件偵測(Object Detection);
C實例分割(Instance Segmentation);
D全景分割(Panoptic Segmentation)
✅ 正確答案:(D) 全景分割(Panoptic Segmentation)
某媒體公司計畫導入 CLIP(Contrastive Language–Image Pre- training)模型,以協助大量影像自動標註與搜尋,並希望在無需新 增標訓資料的情況下,僅透過文字提示(Text Prompt)即可識別影 像內容。請問此應用情境中,CLIP能夠達成的關鍵技術特性為何?
A透過圖文對比式學習(Contrastive Learning)將影像與文字映 射至共同嵌入空間(Shared Embedding Space),可直接以語意相似 度進行零樣本分類;
B透過影像增強與特徵擴散降低標訓資料需求;
C以監督式學習結合多層感知器(Multilayer Perceptron, MLP) 進行影像特徵分類;
D以自迴歸生成模型(Autoregressive Model)逐步生成文字標籤 描述影像內容
✅ 正確答案:(A) 透過圖文對比式學習(Contrastive Learning)將影像與文字映 射至共同嵌入空間(Shared Embedding Space),可直接以語意相似 度進行零樣本分類;
某資料科學團隊在開發預測模型時,針對多種模型設定(如學習率、 樹深度、正則化係數等)進行系統化測試,希望找出在驗證資料上表 現最穩定的組合。此過程最可能採用下列哪一種方法?
A使用交叉驗證(Cross Validation)反覆評估模型以降低過擬合 風險;
B透過網格搜尋(Grid Search)在多組超參數設定中進行系統化搜 尋與評估;
C以隨機搜尋(Random Search)快速探索部分參數空間以提升搜尋 效率;
D採用貝葉斯優化(Bayesian Optimization)根據歷次結果動態調 整搜尋方向
✅ 正確答案:(B) 透過網格搜尋(Grid Search)在多組超參數設定中進行系統化搜 尋與評估;
某公司正在訓練一個大型語音合成模型,開發團隊使用多台 GPU 進行 訓練,但經常出現 GPU 記憶體不足問題。由於模型架構已固定且無 法更換硬體,團隊希望在維持模型效能與收斂品質的前提下,下列哪 一種方法最有效降低單張 GPU 的記憶體壓力?
A減少訓練資料量以降低記憶體使用;
B採用較小的批次大小(Batch Size)並搭配資料分片(Data Sharding)分散訓練負載;
C增加學習率(Learning Rate)以加快收斂速度;
D改用測試資料集(Test Set)進行部分訓練以節省空間
✅ 正確答案:(B) 採用較小的批次大小(Batch Size)並搭配資料分片(Data Sharding)分散訓練負載;
某影像設計團隊在使用 Stable Diffusion生成 4K級產品圖時,發現 影像邊緣與細節存在顆粒化與模糊現象。 若僅能在生成階段進行調整,希望提升畫面清晰度與紋理層次,同時 避免過度平滑,下列哪一項作法最適合?
A降低取樣步數,以縮短生成時間;
B增加取樣步數並選擇高品質取樣器,以強化細節還原度;
C提高 CFG(Classifier-Free Guidance)值,使生成結果更具創意 與多樣性;
D改用低解析度輸入以降低計算成本
✅ 正確答案:(B) 增加取樣步數並選擇高品質取樣器,以強化細節還原度;
某企業的資料科學團隊利用 ARIMA模型(AutoRegressive Integrated Moving Average Model)預測每週產品銷售量。模型建 立完成後,分析人員發現預測誤差隨時間呈現週期性波動,且自相關 函數(ACF)顯示殘差在多個時滯(Lag)上仍顯著不為零。根據上述 現象,最合理的模型診斷結論為何?
A模型殘差符合白噪音(White Noise)假設,預測表現穩定;
B模型殘差雖有輕微異常,但可視為隨機誤差忽略不計;
C模型存在配適不足(Underfitting)問題,需重新調整 p 或 q 參數以捕捉時間依賴性;
D殘差特性不影響預測結果,無須進一步修正
✅ 正確答案:(C) 模型存在配適不足(Underfitting)問題,需重新調整 p 或 q 參數以捕捉時間依賴性;
下列哪一項最正確地描述了 VAE(Variational Autoencoder)、GAN (Generative Adversarial Network)與擴散模型(Diffusion Model)在多模態潛在空間對齊(Latent Alignment)與生成策略上 的根本差異?
AVAE透過顯式潛在變數建模實現跨模態對齊,適合捕捉整體語意結 構但生成解析度有限;GAN透過對抗損失(Adversarial Loss)在不 同模態間學習分佈映射,生成品質高但穩定性差;擴散模型則以條件 化噪聲反推(Conditional Denoising)方式實現高保真跨模態生 成,兼具穩定性與多樣性;
BVAE與 Diffusion Model均屬隱式生成架構,主要依賴對抗式訓 練實現跨模態對齊;GAN則以顯式後驗估計方式提升樣本一致性;
CVAE與 GAN 均使用馬爾可夫鏈(Markov Chain)進行跨模態轉換; Diffusion Model 則透過 KL散度最小化學習語意對應。;
D三者在多模態應用中皆依賴同一潛在表徵空間(Shared Latent Space),僅在解碼器結構不同而已
✅ 正確答案:(A) VAE透過顯式潛在變數建模實現跨模態對齊,適合捕捉整體語意結 構但生成解析度有限;GAN透過對抗損失(Adversarial Loss)在不 同模態間學習分佈映射,生成品質高但穩定性差;擴散模型則以條件 化噪聲反推(Conditional Denoising)方式實現高保真跨模態生 成,兼具穩定性與多樣性;
在進行超參數調校(Hyperparameter Tuning)時,若直接在 K-Fold 交叉驗證(Cross-Validation)的資料上同時調整模型參數並評估效 能,最可能導致下列哪一種問題?
A模型的交叉驗證結果出現過度樂觀偏差(Over-optimistic Bias),因測試摺資料間接參與參數選擇,造成資料洩漏(Data Leakage);
B模型會在每一摺(Fold)內反覆調整參數,導致訓練不穩與過度 正則化;
C因交叉驗證資料被重複使用,造成效能方差增大,無法獲得穩定 估計;
DK-Fold 交叉驗證的假設與超參數搜尋相衝突,導致驗證過程失效
✅ 正確答案:(A) 模型的交叉驗證結果出現過度樂觀偏差(Over-optimistic Bias),因測試摺資料間接參與參數選擇,造成資料洩漏(Data Leakage);
若部署一個深度學習模型至金融風控系統,該模型採用鑑別式架構 (如 Transformer Classifier)。然而上線後,模型對新樣本的分類 錯誤率顯著上升,經檢查發現,輸入資料分佈已與原訓練集明顯不 同。針對此情形,下列哪一種應對策略最為適合?
A改用生成對抗網路(GAN)生成新樣本並混入訓練集;
B改用邏輯迴歸模型(Logistic Regression)以提升穩定性;
C增加模型容量(Model Capacity),以學習更多樣本差異;
D使用變分自編碼器(VAE)監控潛在空間分佈,偵測輸入資料偏移
✅ 正確答案:(D) 使用變分自編碼器(VAE)監控潛在空間分佈,偵測輸入資料偏移
某金融科技公司欲導入 AI模型協助客服郵件自動分類(投訴、詢 問、表揚)。團隊同時考慮兩種模型設計: 方案 A(生成式路徑):採用 VAE建構潛在語意空間,再結合下游分 類器進行標籤預測; 方案 B(鑑別式路徑):採用 BERT Classifier 直接根據輸入文本進 行監督式分類。 現有標註資料約 2,000 筆,資料分佈均勻但擴充成本高。若團隊希 望公平比較兩種模型的資料利用效率與泛化能力,下列哪一種實驗設 計最能突顯兩者的本質差異?
A在完整資料集上分別訓練兩者,並比較其分類準確率 (Accuracy)與推論時間;
B在低資源情境(Low-resource Setting)下,逐步減少標註比例 (100%、50%、10%),比較其 F1-score;
C使用 GAN 自動生成文本樣本補足資料,觀察兩模型在資料增強後 的精確率(Precision)差異;
D在相同訓練資料上固定輸入維度,僅調整模型參數量,比較其對 過擬合的敏感度
✅ 正確答案:(B) 在低資源情境(Low-resource Setting)下,逐步減少標註比例 (100%、50%、10%),比較其 F1-score;
某電信公司希望建立一個模型來預測顧客是否即將流失,並進一步模 擬不同促銷或服務策略下顧客的行為變化,以生成多樣化的虛擬樣本 資料進行 A/B 測試與行銷策略評估。若要同時兼顧預測與資料生成的 需求,最適合採用下列哪一種方法?
A使用傳統隨機森林(Random Forest);
B使用邏輯迴歸(Logistic Regression)模型;
C使用變分自編碼器(Variational Autoencoder, VAE)或生成對 抗網路(Generative Adversarial Network, GAN);
D使用強化學習代理(Reinforcement Learning Agent)
✅ 正確答案:(C) 使用變分自編碼器(Variational Autoencoder, VAE)或生成對 抗網路(Generative Adversarial Network, GAN);
進行影像分類任務時,研究團隊嘗試利用主成分分析(Principal Component Analysis, PCA)將輸入特徵從 1024維降至 100維,並將 降維後的資料輸入支持向量機(Support Vector Machine, SVM)模 型進行訓練。關於此作法,下列哪一項描述最為合理?
APCA保留的主成分必然能提升 SVM的分類準確率;
B使用原始高維資料通常更能保留資訊,因此 PCA沒有實際意義;
CPCA可讓 SVM自動適用於非線性(Nonlinear)資料集;
D降維後可降低訓練時間並減少過擬合(Overfitting)風險
✅ 正確答案:(D) 降維後可降低訓練時間並減少過擬合(Overfitting)風險
某企業的 AI 模型已部署於線上服務環境中,用於即時預測顧客流失 機率。近期團隊注意到模型預測準確率逐漸下降,但系統運作正常且 未出現錯誤訊息。經分析發現,近期輸入資料的分布與模型訓練資料 相比出現顯著偏移。若要在 MLOps流程中主動偵測並預警此類問題, 最應採用下列哪項措施?
A建立即時的資料漂移(Data Drift)與概念漂移(Concept Drift)監測機制;
B將模型轉換為量化版本以降低延遲;
C增加模型超參數調整次數以強化適應性;
D使用固定隨機種子(Random Seed)確保訓練穩定
✅ 正確答案:(A) 建立即時的資料漂移(Data Drift)與概念漂移(Concept Drift)監測機制;
某金融科技公司導入多任務學習架構,讓單一 Transformer 模型同 時執行 OCR(Optical Character Recognition)後的文檔分類以及命 名實體辨識(Named Entity Recognition, NER)任務, 以協助自動歸檔與抽取關鍵金融資訊。在部署初期,團隊發現當模型 的 NER準確率(Accuracy)提升時,文檔分類準確率反而下降。若模 型架構正確且資料品質良好,下列哪一項最可能是造成此現象的原 因?
A模型架構無法同時支援文字分類與序列標註任務(Sequence Labeling);
B文檔分類任務不需要語意化表徵(Contextualized Representation);
C損失函數(Loss Function)未進行權重平衡,導致任務間競爭;
D所使用的 BERT模型無法支援多任務輸出頭(Multi-Head Outputs)
✅ 正確答案:(C) 損失函數(Loss Function)未進行權重平衡,導致任務間競爭;
某數據工程師使用 DBSCAN演算法對一份數百萬筆的高維顧客資料進 行聚類分析,但發現程式執行速度極慢,甚至出現記憶體不足的情 況。若要在不改變演算法核心邏輯的前提下,最有效提升其運算效率 的作法為何?
A改用以平均連結(Average Linkage)為基礎的階層式群集法 (Hierarchical Clustering);
B採用高效率的距離索引結構(Distance Index Structure),例如 KD-Tree 或 Ball Tree;
C將 ε(Epsilon)參數調得極小,以減少鄰近點的數量;
D在資料前處理時增加標準化後的特徵維度數
✅ 正確答案:(B) 採用高效率的距離索引結構(Distance Index Structure),例如 KD-Tree 或 Ball Tree;
某電商平台導入 AI情感分析模型,用以自動偵測顧客評論中的負面 情緒並觸發客服機制。然而,上線後發現模型在面對不同語言或族群 書寫風格的評論時表現不一致,例如部分語氣強烈的正面評論被誤判 為負面,而禮貌但含批評意圖的評論卻被判為中性。若從技術與資料 治理的角度分析,下列哪一項描述不正確?
A模型未啟用詞嵌入正規化(Embedding Normalization)可能造成 語意距離不穩定,導致預測誤差;
B訓練語料若偏向特定文化或語氣特徵,可能使模型產生內隱偏誤 (Implicit Bias);
C模型若訓練資料來源不平衡,容易導致對不同語言或族群風格的 情緒判斷不準確;
DTransformer 架構能捕捉上下文語意,但若訓練資料偏差仍存在, 模型仍可能學習到偏誤判斷
✅ 正確答案:(A) 模型未啟用詞嵌入正規化(Embedding Normalization)可能造成 語意距離不穩定,導致預測誤差;
某設計師使用公司內部建置的生成式 AI工具製作行銷素材,並輸入 提示語(Prompt):「請生成一張模特兒手持品牌飲料、背景為海邊夕 陽的照片」。系統能正確生成主要主題與場景,但輸出的圖像中,品 牌標誌顏色常有誤差,或人物手部姿勢顯得不自然。若從多模態生成 模型的技術機制分析,此現象最可能是下列哪一項原因所造成?
A擴散式生成模型的去雜訊過程出現隨機梯度漂移,導致影像像素 錯誤;
B提示語過長造成 Transformer 的位置編碼超出上下文限制,導致 生成混亂;
CCLIP 模型中的文字編碼器與影像編碼器在語意嵌入空間未充分對 齊,導致跨模態理解偏差;
D模型未採用對比學習(Contrastive Learning)損失函數,無法 建立多模態語意關聯 《以下空白》
✅ 正確答案:(C) CLIP 模型中的文字編碼器與影像編碼器在語意嵌入空間未充分對 齊,導致跨模態理解偏差;