網易首頁 > 網易號 > 正文申請入駐

六西格瑪系列 · 06篇｜用Minitab做假設檢驗，真的沒那么難

2026-05-17 07:13:25　來源: 敖博管理

上海舉報

分享至

六西格瑪系列 · 第06篇

用Minitab做假設檢驗，真的沒那么難

從業務問題到統計檢驗的思路轉換，用供應商來料質量對比做一次完整實操。

做了幾年質量的人，大概都遇到過這種場景：

供應商A的來料均值是10.02mm，供應商B是10.05mm。

老板問你：這兩個供應商質量差異大不大？能不能切換？

你看著這兩組數據，0.03mm的差距——到底算不算顯著？

很多人到這一步就卡住了。不是不會算，是不知道從哪兒下手。

有人拍腦袋說"差不多"，有人翻出兩組數據一比就說"差很多"，還有人直接讓采購去壓價……但都沒說服力。

假設檢驗，就是幫你把這種"憑感覺"的判斷，變成一個有數據支撐的結論。而且有了Minitab這個工具，操作層面真的沒那么難——難的是思路。

第一步：把"人話"翻譯成"統計語言"

假設檢驗最難的不是按哪個按鈕，而是——你怎么把一個業務問題，翻譯成統計檢驗能處理的形式。

拿剛才的例子：

業務問題：供應商A和供應商B的來料質量有沒有顯著差異？

翻譯成統計問題：兩組樣本的均值是否存在統計學上的顯著差異？

對應的檢驗方法：雙樣本t檢驗（2-Sample t-Test）

你看，就這么簡單。但很多質量人卡在這一步，是因為他們直接跳到"用什么檢驗"，跳過了"我想驗證什么"。

記住：先想清楚你要證明什么，再選工具。思路對了，Minitab只是幫你算的那只手。

常用假設檢驗選擇指南

不是所有問題都用t檢驗。下表幫你快速找到該用哪個。

你想比較什么？ 數據類型 推薦檢驗方法 一組數據的均值 vs 目標值連續型 單樣本t檢驗 兩組數據的均值比較連續型 雙樣本t檢驗 三組及以上均值比較連續型 單因素方差分析（ANOVA） 兩組數據的方差比較連續型 雙樣本方差檢驗（F檢驗） 合格率/不良率比較離散型 比率檢驗（Proportion Test） 改善前后配對數據連續型（配對） 配對t檢驗（Paired t-Test）

建議：把這個表截圖保存。實際工作中80%的假設檢驗場景，這張表就能覆蓋。

Minitab實操：供應商來料質量對比

現在用一個完整案例，帶你走一遍假設檢驗的全流程。

案例背景

你公司的一款沖壓件，關鍵尺寸規格為 10.00 ± 0.10mm。目前由供應商A供貨，采購想引入供應商B降本。你需要評估：兩家供應商的產品質量是否存在顯著差異。

你從兩家供應商各隨機抽取了25個樣品，測量關鍵尺寸。

1 錄入數據

在Minitab中新建工作表，設置兩列：C1命名為"供應商A"，C2命名為"供應商B"。將25個測量值分別錄入兩列。

2 先做描述性統計，"看看"數據

路徑：統計 → 基本統計量 → 描述性統計。把兩列都選進去，勾選"均值"、"標準差"、"最小值"、"最大值"。先別急著做檢驗，先讓數據"說話"。看看均值差多少、波動大不大、有沒有明顯異常值。

3 先檢驗方差是否相等（這一步很多人跳過了）

路徑：統計 → 基本統計量 → 雙方差。為什么要做這一步？因為雙樣本t檢驗分兩種：等方差假設和不等方差假設。先判斷方差齊不齊，才能決定用哪種t檢驗。看輸出的p值：p > 0.05說明方差無顯著差異，可以用等方差t檢驗；p ≤ 0.05說明方差有差異，得用不等方差t檢驗。

4 執行雙樣本t檢驗

路徑：統計 → 基本統計量 → 雙樣本t。選擇"每個樣本位于其自身的列"，分別選入C1和C2。勾選"置信區間"（默認95%）。根據第3步的結果，勾選"假定等方差"或不勾選。

5 解讀結果

看Session窗口輸出的結果。重點關注兩個值：t值和p值。但說實話，對質量人來說，你只需要盯住p值就夠了。

p值到底怎么讀？一句人話講清楚

很多教材把p值講得云里霧里，我用最直白的方式說：

你的零假設（H?）：兩家供應商沒有顯著差異（差異 = 0）。

p值的意思：如果H?是真的（兩家真沒差異），那么我觀察到當前數據（或更極端數據）的概率有多大。

判斷標準：p值越小，說明"沒差異"這個假設越站不住腳。

p值范圍 結論 大白話翻譯 p > 0.05 不拒絕H? 沒證據說兩家有差異，目前看起來差不多 0.01 < p ≤ 0.05 拒絕H? 有差異，但不算特別強烈 p ≤ 0.01 強烈拒絕H? 差異非常顯著，基本可以認定不一樣

回到我們的案例：如果Minitab跑出來p = 0.032（假設）。

因為 0.032 < 0.05，所以結論是：兩家供應商的產品尺寸存在顯著差異。那接下來就要結合均值差和工程判斷——差異方向是什么？幅度多大？對裝配有沒有影響？統計給你的是"有沒有差異"，工程判斷給你的是"差異重不重要"。

質量人做假設檢驗的4個常見坑

1 p > 0.05就等于"沒差異"？

不是。p > 0.05只是說"沒有足夠的證據證明有差異"，不是說"證明了沒差異"。這是兩碼事。可能只是你的樣本量不夠，檢測不出來。所以正確的說法是"未能拒絕零假設"，而不是"接受了零假設"。

2 樣本量太小就做檢驗

你拿5個樣品就去做t檢驗，p值再好看也不可信。為什么？因為樣本量太小，檢驗的"功效"（Power）不夠，容易犯第二類錯誤——明明有差異，你卻沒檢測出來。一般建議每組至少20個以上。

3 只看p值，不看實際差異大小

樣本量足夠大的時候，0.001mm的微小差異也可能得出 p < 0.05。這時候統計上"顯著"了，但工程上根本無所謂。所以一定要看均值差（或置信區間），結合規格公差來判斷，不能只盯著p值。

4 數據不符合正態分布就直接做t檢驗

t檢驗假設數據服從正態分布。如果數據明顯偏態（比如圓度、跳動這類不可能是負值的數據），先做正態性檢驗（Minitab：統計 → 基本統計量 → 正態性檢驗）。如果p < 0.05，數據不正態，應該用非參數檢驗（如Mann-Whitney檢驗），別硬上t檢驗。

總結：假設檢驗的正確打開方式

1 明確業務問題：你想證明什么？比較均值？比較方差？還是比較比率？

2 收集足夠的數據：每組至少20個，隨機抽樣，注意測量系統

3 描述性統計：先"看"數據，了解分布、均值、波動

4 前提驗證：正態性檢驗、方差齊性檢驗

5 執行檢驗：選對方法，跑Minitab

6 結合工程判斷：統計顯著不等于工程重要，要看實際差異大小

核心要點：假設檢驗的關鍵不在Minitab操作，在于"思路"——先搞清楚業務問題，再選對統計方法，最后結合工程判斷下結論。Minitab只是幫你算的那只手，腦子得在你自己身上。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.