資料預覽
選擇分析方法
異常偵測 (Outlier Detection):用來找出資料中的離群值,常用於品質監控、異常交易偵測與資料清洗。
選擇偵測方法
預設 3 (嚴格), 2.5 (寬鬆)
預設 1.5 (標準), 3 (極端)
找出造成問題的關鍵點 (80/20法則)。
魚骨圖 (Fishbone/Ishikawa Diagram):用於分析問題的根本原因,將導致問題的因素分類呈現,常用於品質管理與問題解決。
📋 資料格式要求:
請上傳包含 PARENT 和 CHILD 欄位的資料。
• PARENT:主要原因類別 (如:人員、機台、物料、方法、環境)
• CHILD:各類別下的細項原因
比較不同組別或樣本之間,數值資料的平均值是否存在顯著差異。
卡方檢定(Chi-Square Test):檢定兩個類別變數之間是否存在顯著關聯性。適用於問卷調查、市場研究等情境。
📊 使用情境
- • 性別與產品偏好是否相關?
- • 教育程度與職業類型是否獨立?
- • 地區與購買行為是否有關聯?
探討兩個數值變數之間的關聯性,包含完整統計推論。
探討多個自變數對應變數的影響,適合實務應用。
💡 按住 Ctrl (Win) 或 Cmd (Mac) 選擇多個
視覺化所有數值變數之間的相關性,快速找出高度正相關或負相關的變數配對。
📊 相關係數 |r| 強度參考
💡 按住 Ctrl (Win) 或 Cmd (Mac) 選擇多個變數
文字雲 (Wordcloud):用於快速觀察文字欄位中常出現的關鍵字與主題。
建議選擇備註、客服紀錄、意見欄位等文字型欄位。
文字雲結果
管制圖 (Control Chart):X̄ & R Chart 用於監控製程變異,識別特殊原因變異,確保製程處於統計管制狀態。
子群組設定 (Subgroup Settings)
n=1:I-MR Chart (個別值-移動全距圖);n≥2:X̄-R Chart (平均值-全距圖)
管制限設定 (Control Limits)
📏 規格線設定 (可選填)
💡 留空的欄位則不繪製該規格線。規格線只會顯示在 I Chart 上。
管制圖分析結果
製程能力分析 (Process Capability):計算 Cp、Cpk、Pp、Ppk 等指標,評估製程控制能力與一致性。
規格限制 (Specification Limits)
💡 若僅提供單邊規格,另一側留空即可。
進階設定
用於短期變異估計 (Cp/Cpk);設為 1 時使用合併標準差
製程能力分析結果
線性規劃 (Linear Programming):在有限資源與約束條件下,找出最佳化(最大利潤或最小成本)的決策方案。
📦 決策變數
🎯 目標函數係數 (每單位貢獻值/成本)
目標函數:Z = c₁·x₁ + c₂·x₂ + ...
⚖️ 約束條件
💡 非負約束 (x₁, x₂ ≥ 0) 已自動包含
📊 求解結果
多維度泡泡圖 (Bubble Chart):同時呈現多個維度的資料關係 — X軸、Y軸、泡泡大小、泡泡顏色、標籤、時間。
選擇一個數值欄位控制泡泡大小
選擇類別或數值欄位控制顏色
進階設定
所有標籤值顯示在同一張圖
每個標籤值產生獨立圖表 (最多25張)
選擇如 Year、Month 等時間欄位
多維度泡泡圖
移動平均 (Simple Moving Average):計算固定視窗內的平均值,平滑短期波動以識別長期趨勢。
取消勾選 Auto 後可手動調整參數:
單指數平滑 (Simple Exponential Smoothing):適用於無明顯趨勢或季節性的數據,給予近期數據較高權重。
取消勾選 Auto 後可手動調整參數:
雙指數平滑 (Double Exponential Smoothing / Holt's Linear):適用於具有趨勢但無季節性的時間序列數據。
取消勾選 Auto 後可手動調整參數:
Holt-Winters 三次指數平滑法 (Triple Exponential Smoothing):適用於具有趨勢性 (Trend) 與季節性 (Seasonality) 的時間序列數據。 模型包含三個平滑參數:α (水平)、β (趨勢)、γ (季節)。本系統採用乘法季節模式 (Multiplicative),適合季節波動幅度隨數據水平成比例變化的情境。
取消勾選 Auto 後可手動調整參數:
使用「古典分解法 (Classical Decomposition)」將時間序列拆解為趨勢 (Trend)、季節性 (Seasonality) 與殘差 (Residual),並進行疊加預測。
例如:月資料多為 12、週資料可設 52。
使用 ARIMA 模型(差分 + 自迴歸 AR + 移動平均 MA)進行時間序列預測,適合平穩或經差分後平穩的資料。 本工具實作 ARIMA(p, d, q),在純 JavaScript 環境中,採用 Hannan–Rissanen 兩階段迴歸法,以 OLS 估計 AR (φ) 與 MA (θ) 係數。
取消勾選 Auto 後可手動調整參數:
LSTM (Long Short-Term Memory):深度學習遞迴神經網絡,適用於捕捉長期時序依賴性的複雜時間序列預測。
⚠️ 注意:LSTM 模型訓練耗時較長,請耐心等待。訓練過程使用 TensorFlow.js 在瀏覽器端執行。
使用 Croston 方法處理間歇性需求(多為 0,偶爾出現正需求),適合備品、慢料等需求預測教學。 Croston 模型對未來各期提供相同的預測水準。
控制「大小」平滑速度
控制「間隔」平滑速度
Bass 擴散模型 (Bass Diffusion):用於預測新產品採用曲線,分析創新者 (p) 與模仿者 (q) 效應。
外部影響力 (0.01-0.05 常見)
內部影響力 (0.3-0.5 常見)
最終總採用人數
💡 教學提示: 當 q/p > 1 時,採用曲線呈現 S 型,高峰出現在累積採用量約 50% 處。 典型值:p ≈ 0.03, q ≈ 0.38。
建立模型以預測二元結果 (例如:是/否、成功/失敗)。
此選單只會顯示資料中剛好有兩種值的類別欄位。
按住 Ctrl (或 Mac 上的 Command) 可複選。
建立迴歸決策樹模型,預測數值結果並找出關鍵因子。
支持向量機 (Support Vector Machine):適用於分類與迴歸任務,擅長處理高維度資料與非線性問題。
🎯 功能特色
- • SVM 分類:適合二元分類與多類別分類
- • SVR 迴歸:支持向量迴歸,適合非線性關係
- • 核函數:支援 Linear、RBF、Polynomial 核
- • 高維適應:特徵數多於樣本數時仍有效
使用 SVM 進行分類預測,找出最佳超平面區分不同類別。
💡 建議使用數值變數
⚙️ 核函數與參數設定
使用 SVR (Support Vector Regression) 進行數值預測,適合處理非線性迴歸問題。
💡 建議使用數值變數
⚙️ 核函數與參數設定
🔮 模型預測
輸入特徵值,使用已訓練的模型進行預測:
隨機森林 (Random Forest):強大的整體學習方法,透過組合多棵決策樹提升預測準確度。 支援分類和迴歸兩種任務,並提供變數重要性排名。
🌲 核心優勢
- • 高準確度:多棵樹投票,降低過擬合風險
- • 變數重要性:識別關鍵影響因子(適合 DOE 分析)
- • 穩健性:對雜訊和缺失值有較強容忍度
- • 無需特徵縮放:直接處理不同尺度的變數
預測連續數值結果(如:銷售額、產品硬度、良率)。系統將建立多棵迴歸樹並平均預測值。
💡 按住 Ctrl (Win) 或 Cmd (Mac) 多選,建議 5-50 個變數
⚙️ 模型參數設定
預設 100(50-200 推薦)
預設 10(避免過擬合)
預設 5
每棵樹隨機選取的特徵數
預測類別結果(如:良品/不良品、高/中/低風險)。系統將建立多棵分類樹並透過投票決定最終類別。
自動偵測類別變數(2-10 個類別)
💡 支援數值和類別變數混合
⚙️ 模型參數設定
神經網絡 (Neural Network):適合處理非線性關係的分類與迴歸問題,常用於影像辨識、文字分類、異常偵測等情境。
🧠 使用建議
- • 當「線性迴歸」或「決策樹」效果不足時,可嘗試神經網絡。
- • 資料筆數越多、特徵越多,神經網絡的優勢越明顯。
- • 需注意過擬合,建議搭配驗證集、正規化與早停策略。
Y 可為連續數值(迴歸)或類別變數(分類);系統會自動判斷任務型型。
建議優先選擇數值型特徵;類別變數需先做 One-Hot Encoding 或數值化處理。
可先從 8~32 嘗試,再視效能調整。
示範用途建議 100~300;實務應視資料量調整。
此版本將在瀏覽器端使用 TensorFlow.js 訓練簡單的 MLP 模型,並計算 Permutation Importance,搭配 Plotly 長條圖展示特徵重要度。
主成分分析:降維、特徵提取、變數縮減,找出解釋最多變異的主要成分。
💡 按住 Ctrl (Win) 或 Cmd (Mac) 選擇多個變數
因素分析:找出潛在因子,解釋變數間的共同變異,適合量表編製和結構探索。
💡 按住 Ctrl (Win) 或 Cmd (Mac) 選擇多個變數
K-Means 集群分析:將資料點依相似性分成 K 個群組,適用於客戶分群、市場區隔、異常偵測等應用。
🎯 應用場景
- • 客戶分群(RFM分析)
- • 產品定位與市場區隔
- • 庫存管理優化
- • 異常值偵測
💡 按住 Ctrl (Win) 或 Cmd (Mac) 選擇多個變數
建議先用Elbow法找最佳K值
階層式集群 (Hierarchical Clustering):適用於 < 1000 筆樣本 的分群分析,支援數值 / 類別 / 混合資料。 可用於客戶分群、問卷分群、產品組合分析等情境。
📐 功能重點
- • 支援數值、類別與混合型資料 (Gower 距離)
- • 多種連結方法:Ward、Complete、Single、Average、Centroid
- • 互動式樹狀圖 + 動態切割線 (拖曳群集數)
- • 集群著色熱圖 + 輪廓係數 (Silhouette) 評估圖
💡 建議 2–6 個變數,樣本 < 1000 筆,以維持瀏覽器流暢度。
🔎 若混合數值 + 類別,系統會自動改用 Gower 距離。
預設 p = 3。p=2 相當於 Euclidean,p=1 為 Manhattan。
⚠️ Ward / Centroid 僅在「全部為數值變數且距離為 Euclidean」時啟用,否則自動改為 Average。
系統會依 K 值在樹狀圖上畫出切割線,同時更新熱圖與輪廓係數圖。
🌳 互動式樹狀圖 (Dendrogram)
🔥 集群著色熱圖
📈 輪廓係數 (Silhouette) 評估圖
關聯規則挖掘 (Apriori Algorithm):發現交易資料中商品之間的關聯性,適用於購物籃分析、交叉銷售策略。
🛒 經典案例
- • 啤酒 🍺 → 尿布 👶 (週五晚上購物關聯)
- • 筆記型電腦 💻 → 滑鼠 🖱️ + 滑鼠墊
- • 麵包 🍞 → 牛奶 🥛 + 果醬
用於區分不同交易
商品或項目名稱
預設 0.01 (1%)
預設 0 (顯示所有規則)
預設 0 (顯示所有規則)
❓ 參數說明
Support (支持度): 項目組合在所有交易中出現的比例
Confidence (信賴度): 買了A之後買B的條件機率
Lift (提升度): 關聯強度,>1表示正相關,=1表示獨立,<1表示負相關< /p>