田口法與實驗設計 DOE SPC + AI

DOE/SPC 決策訓練系統與 AI 輔助應用

Cliff Wang

Cliff Wang, Ph.D. 王啟岳博士

dr.cliffwang@a2psdm.com

課程 Podcast

IC 廠案例

PVD / Etching / CMP / Wire Bonding / 光阻配方,每個方法配一個半導體真實情境。

AI Prompt

含 Gate 階段專屬,從選 DOE 類型到 Control Plan 自動生成。

互動工具

DOE 決策樹、Gage R&R 計算器、SPC 圖樣體檢、EWMA 模擬、Cpk 拖動、ANOVA 流程。

Module 課程地圖

1
統計基礎 · 描述統計、分配、抽樣、Cp/Cpk、SPC 七工具與管制圖
2
關聯分析 · 簡單迴歸、多元迴歸、Stepwise、Logistic、Ridge/Lasso/PLS(新增)
3
實驗設計核心 · ANOVA、田口 L9/L8、2K Full、2K-P Partial、多響應 Y 最佳化
4
DOE 進階(強化重點) · RSM、DSD、Split-Plot、Mixture、Robust Parameter Design 三段式
5
量測與管制(強化重點) · MSA、EWMA、CUSUM、多變量管制圖、SPC↔APC 銜接
6
AI × DOE(全新章節) · Prompt 工程、Vibe Coding、AI Agent、與 Minitab Copilot/JMP AI 整合
7
整合應用 · 8D/DMAIC 與 DOE 串接、跨課程整合、Capstone Project

DOE 類型互動決策樹

回答下面 5 個問題,系統會推薦最適合的 DOE 方法,並說明為什麼不選其他選項。

1因子數(X variables)
2~3
4~5
6+
2是否需要看交互作用
需要 (Interactions)
先篩主效果即可
3是否懷疑有曲率(Curvature)
是 (要曲面)
否 (線性即可)
4有 Hard-to-change 因子嗎?
有 (如爐管溫度)
沒有
5是否有 Noise Factor,且目標是穩健化?
有(如 lot、環境、原料批次)
沒有或暫不處理

方法速查表

方法適用情境典型實驗數能多 Y?
田口 L94 因子 3 水準快速篩選9
田口 L8 + 交互4 因子 2 水準,需特定交互8
2K Full Factorial2~4 因子,看完整交互作用2^k × Replicates
2K-P Partial5+ 因子篩選,預算有限2^(k-p)
DSD6+ 因子,同時要篩主效果與曲率2k+1 ~ 2k+4
RSM (CCD)2~5 關鍵因子最佳化,要曲面2^k + 2k + center
RSM (Box-Behnken)3~7 因子 RSM,避免角點變動
Robust Parameter Design有 Noise Factor,要降低變異、提高穩健性Inner × Outer Array通常否
Split-Plot有 Hard-to-change 因子變動
Mixture Design配方類因子(總和=100%)視成分數

DOE 的入場券與離場票:MSA / SPC Gate

9 成失敗的 DOE 不是輸在統計,而是輸在 Gate。 量測雜訊比因子效應大、Baseline 在漂移、或最佳化結果交不出 Control Plan,再漂亮的 ANOVA 也救不回來。 本分頁提供三道 Gate 的互動檢核工具,下一個實驗就能用。

來自業界的觀察: AIAG 與 SEMI 的調查指出,半導體廠 DOE 失敗案例中,43% 是因為跳過 MSA27% 是因為 baseline 不穩18% 是因為最佳化結果無法導入量產。三者加總超過 88%。

Gate 1 · 量測能信嗎

Before DOE

如果量測誤差比因子效應還大,DOE 會把雜訊當成顯著效果。

  • ✓ Gage R&R 計算 %GRR、NDC
  • ✓ 對破壞性、Attribute 用對方法
  • ✓ 偏差/線性度確認
↓ 前往 Gage R&R 互動計算

Gate 2 · 製程穩定嗎

Before DOE

不穩定的 baseline 會讓 special cause 混進實驗,誤導結論。

  • ✓ 對照 4 種典型 SPC 圖樣
  • ✓ Western Electric Run Rules
  • ✓ 大事件 / 漂移先處理再做 DOE
↓ 前往 SPC 圖樣體檢

Gate 3 · 結果守得住嗎

After DOE

最佳參數若沒交接到 Control Plan 與 SPC 監控,3 個月內就會回到原狀。

  • ✓ Confirmation Run 計畫
  • ✓ EWMA / CUSUM 監控小漂移
  • ✓ Control Plan + Reaction Plan
↓ 前往 EWMA 與 Control Plan

Gate 1 · Gage R&R 互動計算器

輸入您的 Minitab 或 JMP MSA 結果,立即得到 IC 廠等級的判定與行動建議。

互動工具
3.0
2.0
20.0
40.0
%GRR (TV)
-
%P/T
-
NDC
-
TV
-
優異
%GRR < 10%
NDC ≥ 8
可接受
%GRR 10-30%
NDC 5-7
不可用
%GRR > 30%
NDC < 5

該用哪一種 MSA 方法

標準 Crossed Gage R&R
非破壞、樣品可重複量測
用途:CD-SEM、OCD、Film Thickness、Overlay
軟體:Minitab → Stat → Quality Tools → Gage Study → Crossed
Nested Gage R&R
破壞性測試(每片只能量一次)
用途:Wire Pull、Ball Shear、Wafer Probe (PCM)
軟體:Minitab → Gage Study → Nested
Attribute Agreement
Pass/Fail、目視檢驗
用途:AOI Bin Code、Defect Class、Macro 目檢
指標:Cohen's Kappa > 0.7、Fleiss Kappa
EMP / Type 1 / Bias
線性度、偏差、長期穩定性
用途:新機台 Qual、定期 MSA Audit
指標:Cg/Cgk、Linearity p-value

Gate 2 · SPC 圖樣體檢

DOE 前先看 baseline。出現以下三種異常圖樣,不要做 DOE,先處理 special cause

視覺診斷

Western Electric Run Rules · 8 條完整版

Minitab 預設只開 1、2、5、6 四條。建議在 IC 廠的關鍵製程開全 8 條。

11 點超出 ±3σ:立即異常停線
2連續 9 點同側:製程平均偏移
3連續 6 點漸增/漸減:趨勢漂移(刀具磨耗、爐溫漂)
4連續 14 點上下交替:系統震盪(兩台機台/兩種原料)
53 點中 2 點落 2σ 外(同側):變異增加警訊
65 點中 4 點落 1σ 外(同側):輕微偏移
715 點落 ±1σ 內:過度集中(量測解析不足或偽造數據)
88 點落 ±1σ 外(兩側皆有):雙峰分配(製程混合)

Gate 3 · 為什麼 IC 廠要用 EWMA

CD、Overlay、Film Thickness 的漂移通常 < 1σ,傳統 Shewhart 抓不到。EWMA / CUSUM 才是半導體標配。

資料模擬
原始資料 EWMA (λ=0.2) UCL/LCL
Shewhart Xbar
最快但要 ≥ 1.5σ 才會發警報。對 CD 偏移已經太晚了。
EWMA 推薦
對 0.5σ 漂移敏感,IC 廠首選。λ=0.2 是經典設定。
CUSUM
對突發 step change 最敏感。設備事件後監控用。

DOE 後的 Control Plan 模板

這是讓 DOE 結果真的能進量產的關鍵交付物。每一個顯著的 X 都應該有一行。

關鍵 X規格 / Target監控方式頻率OOC 反應計畫負責人
CMP Down Force3.2 ± 0.2 psiEWMA (λ=0.2)Every Lot停線 → 校正壓力規 → 檢查 Pad 磨耗Process Eng.
Slurry Flow200 ± 20 mL/minSPC Xbar-RHourly切換備用 Pump → 通知 VendorEquip. Eng.
Pad Conditioning30 sec / WaferRecipe LockEvery Recipe ChangeMES 強制鎖定不可改IE
RR Output (Y1)380 ± 30 Å/minEWMA + ShewhartEvery Wafer觸發 OCAP → DOE 重新最佳化YE / PE
WIWR (Y2)≤ 8%Trend ChartDailyPad/Slurry 對策;超 10% 客訴風險QE

失敗案例 · 跳過 Gate 的代價

背景:某 28nm 廠 Cu CMP 良率異常下滑,PE 緊急啟動 2³ Full Factorial DOE,跑了 32 片實驗 wafer(成本約 NTD 27 萬)。

結果:ANOVA 顯示 Down Force × Slurry Flow 交互作用顯著(p=0.008),按建議參數量產 3 個月。

真相:客戶端反映 thickness 變異反而變大。回頭重做 MSA 才發現:原本 OCD 的 %GRR = 47%(早就該停掉);DOE 抓到的「顯著效應」其實大部分是量測雜訊。

後果:3 個月 RMA + 重工 + 客戶賠償總計超過 NTD 1,200 萬

三條教訓:
  1. 沒做 MSA 的 DOE 不能算數,no exception。
  2. %GRR > 30% 一律停 DOE(這個案例若先做 3 萬元的 MSA,能避免 1,200 萬損失)。
  3. DOE 結果要量產前,再做一次 MSA Audit 與 Confirmation Run。

IC DOE 八步驟 · 含 Gate 與失敗模式

1
定義 CTQ / Y
確認 Y 定義(mean / σ / yield / bin),與客戶規格、內部目標連結
常見失敗:Y 定義不清,事後 ANOVA 無法解釋
2
Gate 1: MSA
%GRR < 10% 最佳;30%+ 停 DOE 先處理量測
常見失敗:跳過 MSA,量測雜訊吃掉因子效應
3
Gate 2: SPC Baseline
看 30 lots 圖樣,drift / shift / 雙峰要先處理
常見失敗:把 special cause 當 noise
4
定義 X / Noise / Block
列 5~8 個候選 X,明確標 hard-to-change、noise factor
常見失敗:Noise 沒納入,量產失效
5
選 DOE 類型
用 DOE 決策樹分頁,含預算與 hard-to-change 評估
常見失敗:所有問題都用 2K Full
6
Randomize / Replicate / Block
必須隨機化跑序;replicate 算純誤差;block 多機台
常見失敗:偷懶照順序跑,時間效應汙染
7
ANOVA / Effect / Residual
五步流程(見 ANOVA 解讀分頁);殘差圖必看
常見失敗:只看 p-value,忽略殘差診斷
8
Gate 3: Confirmation + Control Plan
≥ 5 點 confirmation;EWMA 監控;Control Plan handoff
常見失敗:實驗結束就結束,3 個月後回原狀

Gate 階段專用 AI Prompts

這 5 組 prompt 補足主 AI 庫沒有的 Gate 場景,直接複製到 Claude / ChatGPT 使用。

AI 可協助,但不能取代工程簽核

適合交給 AI
  • 整理 DOE charter、Y/X/Noise/Block 清單
  • 檢查是否遺漏 randomization、replication、blocking
  • 把 Minitab/JMP 輸出轉成主管摘要
  • Gage R&R 結果初步判讀
  • 產生 Control Plan / 8D / DMAIC 報告初稿
必須由工程師決定
  • 實驗條件是否安全、可量產、符合設備限制
  • 機密 recipe、客戶資料是否可外傳
  • MSA 失敗原因的物理根因
  • Confirmation Run 的最終放行
  • Control Plan 的 owner 與 reaction plan

Cp / Cpk 視覺化模擬

拖動滑桿改變製程平均、標準差,即時觀察 Cp、Cpk 的變化。對主管解釋「為什麼平均偏移會吃掉一半的 Cp」最快的工具。

40
60
50
2.0
Cp
-
Cpk
-
IC 廠常用門檻:
• 客戶 Qual 要求 Cpk ≥ 1.33
• 內部高階產品要求 Cpk ≥ 1.67
• Cpk < 1.0 必須立即啟動 8D
怎麼解讀:
  • Cp 只看「分配寬度 vs 規格寬度」,不管在不在中心
  • Cpk 同時看「寬度」與「偏移」,是真正能用的指標
  • 當 μ 偏離規格中心,Cp 不變但 Cpk 直接掉
  • 把 σ 縮小一半 → Cpk 約變兩倍(這是 DOE 改善的核心目的)

進階:半導體常被忽略的 Cpk 細節

Within / Between Cpk
Wafer-to-Wafer 變異 vs Lot-to-Lot 變異要分開算,否則改善方向錯。
非常態 Cpk
Yield、Defect Density 是偏態分配,必須先用 Box-Cox 或 Johnson 轉換。
Cpk vs Ppk
Cpk 是「短期能力」、Ppk 是「長期表現」,差距大代表 SPC 沒做好。

田口法 vs 傳統 DOE 全方位對照

這是學員最容易混淆的概念。本表將兩者從 9 個維度對照,並標示出 IC 廠的選擇建議。

維度田口法 (Taguchi)傳統 DOE (Factorial / RSM)IC 廠建議
實驗次數極少 (L9 = 9 跑)中等 (2³ Full = 8 跑、RSM = 13+)每片 wafer 8000+ 元 → 預算少時田口優先
能求交互作用?L9 飽和不可,L8 可Full 可全部,Partial 視 Resolution新製程開發必須能看 Interaction → 傳統 DOE
能多 Y 嗎?原始版本不行能(Response Optimizer)RR 與 WIWR 同時看 → 傳統 DOE
能含 Block?需特殊設計原生支援多機台實驗 → 傳統 DOE
能含曲率?不容易RSM 專長找最佳值 → RSM
S/N 比?核心特色,同時看均值與變異通常分開分析Robust 設計、Noise factor 多 → 田口
X 數據型態視為文字型 (Nominal)可連續、可離散RSM 必須連續 X
學習曲線陡(需理解直交表概念)緩(Minitab 引導完整)新手先學傳統,老手再加田口
AI 整合難度中(規則明確但軟體少)低(多軟體 / API 成熟)Vibe Coding 場景 → 傳統 DOE

田口法的真正強項

不是「實驗次數少」,而是把 Noise Factor 顯式納入設計。對成本敏感的 OSAT/封裝廠特別有用。

  • Inner Array (Control) × Outer Array (Noise) 的 Crossed Array
  • S/N 比把均值與變異一次處理
  • 適合「先不要找最佳,先要穩健」的場景

傳統 DOE 的真正強項

系統性的演繹分析,能完整解構主效果、交互作用、曲率,並支援多 Y 最佳化。

  • Sequential 策略:Screening → Modeling → Optimization → Confirmation
  • Response Optimizer + Desirability 多 Y 處理
  • 與 SPC、APC、ML 模型無縫銜接

IC 廠案例展示

每個案例都示範「情境 → 方法選擇 → 設計矩陣 → 結論」的完整教學鏈。

Case 01PVD · 田口 L9

PVD 薄膜:4 因子 3 水準快速篩選

情境:新導入一台 AMAT Endura PVD,工程師需在 2 週內找出 Power、Pressure、Time、Ar Flow 四個關鍵參數對 Sheet Resistance 的影響。每片 wafer 成本 NTD 8,500。

因子L1L2L3
Power (W)300050007000
Pressure (mTorr)357
Time (sec)306090
Ar Flow (sccm)305070
對照:Full Factorial 需要 81 跑(NTD 688,500),L9 只要 9 跑(NTD 76,500)→ 節省 89%
結論:Power 為 Rank 1,Pressure 為 Rank 2,後續以這兩個因子做 RSM。
Case 02CMP · 2K Full + Block

CMP Cu Damascene:雙響應最佳化

情境:28nm 邏輯廠 BEOL CMP,需同時最佳化 Removal Rate (350~400 Å/min) 與 WIWR (<8%)。兩台 Polisher 列為 Block。

因子LowHigh
Down Force (psi)24
Table Speed (rpm)60100
Slurry Flow (mL/min)150250
Block: Polisher #A vs B(2 機台)
方法:2³ Full × 2 Replicates × 2 Blocks = 16 跑
結論:用 Response Optimizer,在 Down Force=3.2 / Table=85 / Slurry=200 時,RR=380 且 WIWR=6.2%,Desirability=0.92。
Case 03Wire Bonding · L8 + 交互

Wire Bonding:降低 NSOP 不良

情境:OSAT 廠 Cu Wire Bonding 出現 NSOP(Non-Stick on Pad)不良率 0.8%。已知 Material 與 Diameter 之間可能有交互作用。

因子LowHigh
A: MaterialCuAu
B: Diameter (μm)1825
C: Force (gf)5080
D: Time (ms)1020
方法:L8 含 AB 交互,每組 4 重複求 S/N 比(望大)
結論:AB 交互顯著(p=0.04)。Cu+25μm 表現最佳,NSOP 從 0.8% 降至 0.05%。
Case 04Etching · 2K-P Resolution IV

Plasma Etching:7 因子篩選

情境:新製程 Plasma Etching 有 7 個可調參數,工程師希望在 8 跑內找出 Vital Few。Etch Rate 與 Selectivity 雙目標。

因子LowHigh
Source Power500W1000W
Bias Power50W150W
Pressure10mT30mT
CF4 Flow3060 sccm
O2 Flow515 sccm
Temp40°C80°C
Time30s90s
方法:L8 (2^(7-4)) Resolution III → 8 跑找出 Vital Few,再升為 Resolution V 確認交互
結論:Source Power、Pressure、CF4 為主控因子,從 128 跑降至 8 跑(節省 94%)。
Case 05Photoresist · Mixture Design

光阻配方:Mixture DOE

情境:研發 ArF 光阻配方,含 Polymer / PAG / Solvent / Quencher 四成分(總和=100%),目標最佳化解析度與 LWR(Line Width Roughness)。

成分下限上限
Polymer3%10%
PAG0.5%2%
Solvent85%96%
Quencher0.05%0.3%
方法:Constrained Mixture Design(D-Optimal)+ RSM。傳統 Factorial 不能用,因為總和必須=100%。
結論:Polymer 7.2% / PAG 1.4% / Solvent 91% / Quencher 0.4% 達最佳,解析度提升 12%。
Case 06Furnace · Split-Plot

爐管 Hard-to-Change:Split-Plot

情境:LPCVD 爐管調溫一次需 2 小時穩定,但同一 Run 中可放多片 wafer。Temperature 是 Whole Plot Factor,Time、Pressure 是 Subplot Factor。

層級因子水準
Whole PlotTemperature700 / 750°C
SubplotTime30 / 60 min
SubplotSiH4 Flow50 / 100 sccm
注意:用一般 2K Full 會把溫度變異低估,得出錯誤結論!必須用 Split-Plot 設計。
結論:Minitab 路徑:Stat → DOE → Factorial → Create → Split-Plot Design

10 組可立即套用的 AI Prompt 模板

點任一卡片右上方的「複製」按鈕,貼到 Claude / ChatGPT / Gemini 即可使用。建議將自家機密資料替換為去識別化版本後再用公有雲 LLM。Gate 階段專屬的 5 組請見「MSA/SPC Gate」分頁。

三條安全紅線

機密資料不上公雲
客戶名稱、製程配方、機台 Recipe 必須先去識別化或改用內部 LLM(Foundry / Ollama)。
AI 結論必須由人覆核
特別是 ANOVA 詮釋與優化建議。AI 會幻覺,下廠決策一律由工程師簽核。
Prompt 要寫清楚邊界
明確說「不要假設我有的資料」、「請列出你的不確定處」,可大幅降低錯誤率。

ANOVA 解讀五步流程

學員拿到 Minitab 輸出常常不知該看什麼。這個流程圖把判讀順序固定下來,搭配 AI 使用更穩。

1
先看 Model 整體 p-value
在 ANOVA 表「Model」這一列。p < 0.05 → 模型至少有一個項是顯著的,可以繼續看。
陷阱:p > 0.05 不代表沒效果,可能是樣本太少。檢查 Power Analysis。
2
看 R-sq 與 R-sq(pred) 差距
兩者差 < 5% → 健康。差 > 15% → 模型過擬合,新資料會崩。
IC 廠經驗:R-sq 95% 但 R-sq(pred) 70%,幾乎可確定有過擬合,要簡化模型。
3
逐項看顯著性與 Effect 大小
不只看 p-value,要看 Effect 與 Coef 的數值。顯著 ≠ 重要
排序原則:主效果 → 2 因子交互 → 二次曲率 → 3 因子交互(通常忽略)
4
看殘差圖(Four in One)
這是最被忽略的一步!詳見「殘差口袋卡」分頁。
5
檢查 Lack-of-Fit (LOF)
LOF p < 0.05 → 模型「形狀」不對(可能漏二次項或交互)。
處理:對 Y 取 Log / 加二次項 / 升級到 RSM。

學員最常犯的 5 個 ANOVA 錯誤

  1. 只看 p-value,不看 Effect 大小:p=0.001 但 Effect 0.1,可能在工程上不重要。
  2. 忘了看 VIF:VIF > 10 代表共線性嚴重,係數方向可能反過來。
  3. 把 Block 列為 Factor 解讀:Block 顯著只代表「不同機台有差異」,不能當改善方向。
  4. 過度詮釋三因子交互:除非有強物理意義,三因子交互通常是雜訊。
  5. 不檢查 Outlier:一個 Bad Wafer 可以毀掉整個模型。檢查 Cook's Distance。

殘差圖判讀口袋卡

把這頁存到手機,跑完 DOE 對照查。Minitab 的 Four-in-One 是 DOE 成敗最關鍵的檢核。

Normal Plot · 直線

殘差呈常態分配 → 健康,可信任 p-value。

Normal Plot · S 型

非常態 → 行動:對 Y 做 Box-Cox 或 Log 轉換。

vs Fits · 水平帶狀

變異齊一 → 健康,不需轉換。

vs Fits · 喇叭狀

變異隨配適值放大 → 行動:Y 取 Log 或 √Y。

vs Fits · 曲線

模型漏二次項 → 行動:升級到 RSM。

Histogram · 對稱鐘形

常態 → 健康

Histogram · 偏斜

行動:Box-Cox 找最佳 Lambda。

vs Order · 趨勢

時間相關因素未控 → 行動:加 Block / Random Run Order。

30 秒判讀口訣

「直、平、鐘、亂」 → 全 OK
「彎、喇、偏、趨」 → 動模型
口訣解:直(Normal Plot 直線)、平(vs Fits 水平帶狀)、鐘(Histogram 鐘形)、亂(vs Order 隨機)。反之,彎、喇叭狀、偏斜、趨勢,都是該動模型的訊號。

Capstone Project · 四週實戰

學員以自家工廠真實問題(去識別化)執行完整 DOE 流程,結業時繳交報告 + 5 分鐘 Pitch。

Week 1 · 問題定義與 DOE 規劃

Define
  • 用 SIPOC、是/非(IS/IS-NOT)分析鎖定問題
  • 列出 5~8 個可能因子,含水準範圍與成本
  • 使用「DOE 決策樹」分頁選擇方法,繳交設計矩陣(Minitab/JMP 截圖)
  • 用 AI Prompt #1(選擇 DOE 類型)取得第二意見

Week 2 · 執行實驗與資料蒐集

Measure
  • 實驗順序必須隨機化(Random Order)
  • 每跑一個實驗點即時記錄日誌(含異常事件)
  • 檢查 Gauge R&R 是否 < 10%,避免量測誤差吃掉實驗訊號
  • 學員間互相 Peer Review 設計合理性

Week 3 · ANOVA 分析與最佳化

Analyze
  • 跑完 ANOVA 後,依「ANOVA 解讀」分頁的五步走完
  • 檢查殘差圖(用「殘差口袋卡」對照)
  • 用 Response Optimizer 找最佳組合
  • 用 AI Prompt #2、#3、#4 取得結果解讀

Week 4 · 確認試驗與報告

Improve / Control
  • 執行 Confirmation Run(建議 5 點以上)
  • 對比預測值與實際值,計算 Prediction Error
  • 規劃後續 SPC 監控(建議用 EWMA)
  • 用 AI Prompt #9(8D 報告生成)寫初稿,自己潤飾
  • 5 分鐘 Pitch + Q&A,講師與同學評審

結業認證

通過 Capstone 評審(評分標準:方法選擇 25% + 設計嚴謹度 25% + 結果分析 25% + 簡報能力 25%),可獲得:

a2psdm.com「IC DOE 進階認證」
王啟岳博士簽章證書
學員社群終身存取權