六西格瑪系列 · 第06篇
用Minitab做假設檢驗,真的沒那么難
從業務問題到統計檢驗的思路轉換,用供應商來料質量對比做一次完整實操。
做了幾年質量的人,大概都遇到過這種場景:
供應商A的來料均值是10.02mm,供應商B是10.05mm。
老板問你:這兩個供應商質量差異大不大?能不能切換?
你看著這兩組數據,0.03mm的差距——到底算不算顯著?
很多人到這一步就卡住了。不是不會算,是不知道從哪兒下手。
有人拍腦袋說"差不多",有人翻出兩組數據一比就說"差很多",還有人直接讓采購去壓價……但都沒說服力。
假設檢驗,就是幫你把這種"憑感覺"的判斷,變成一個有數據支撐的結論。而且有了Minitab這個工具,操作層面真的沒那么難——難的是思路。
第一步:把"人話"翻譯成"統計語言"
假設檢驗最難的不是按哪個按鈕,而是——你怎么把一個業務問題,翻譯成統計檢驗能處理的形式。
拿剛才的例子:
業務問題:供應商A和供應商B的來料質量有沒有顯著差異?
翻譯成統計問題:兩組樣本的均值是否存在統計學上的顯著差異?
對應的檢驗方法:雙樣本t檢驗(2-Sample t-Test)
你看,就這么簡單。但很多質量人卡在這一步,是因為他們直接跳到"用什么檢驗",跳過了"我想驗證什么"。
記住:先想清楚你要證明什么,再選工具。思路對了,Minitab只是幫你算的那只手。
常用假設檢驗選擇指南
不是所有問題都用t檢驗。下表幫你快速找到該用哪個。
你想比較什么? 數據類型 推薦檢驗方法 一組數據的均值 vs 目標值 連續型 單樣本t檢驗 兩組數據的均值比較 連續型 雙樣本t檢驗 三組及以上均值比較 連續型 單因素方差分析(ANOVA) 兩組數據的方差比較 連續型 雙樣本方差檢驗(F檢驗) 合格率/不良率比較 離散型 比率檢驗(Proportion Test) 改善前后配對數據 連續型(配對) 配對t檢驗(Paired t-Test)
建議:把這個表截圖保存。實際工作中80%的假設檢驗場景,這張表就能覆蓋。
Minitab實操:供應商來料質量對比
現在用一個完整案例,帶你走一遍假設檢驗的全流程。
案例背景
你公司的一款沖壓件,關鍵尺寸規格為 10.00 ± 0.10mm。目前由供應商A供貨,采購想引入供應商B降本。你需要評估:兩家供應商的產品質量是否存在顯著差異。
你從兩家供應商各隨機抽取了25個樣品,測量關鍵尺寸。
1 錄入數據
在Minitab中新建工作表,設置兩列:C1命名為"供應商A",C2命名為"供應商B"。將25個測量值分別錄入兩列。
2 先做描述性統計,"看看"數據
路徑:統計 → 基本統計量 → 描述性統計。把兩列都選進去,勾選"均值"、"標準差"、"最小值"、"最大值"。先別急著做檢驗,先讓數據"說話"。看看均值差多少、波動大不大、有沒有明顯異常值。
3 先檢驗方差是否相等(這一步很多人跳過了)
路徑:統計 → 基本統計量 → 雙方差。為什么要做這一步?因為雙樣本t檢驗分兩種:等方差假設和不等方差假設。先判斷方差齊不齊,才能決定用哪種t檢驗。看輸出的p值:p > 0.05說明方差無顯著差異,可以用等方差t檢驗;p ≤ 0.05說明方差有差異,得用不等方差t檢驗。
4 執行雙樣本t檢驗
路徑:統計 → 基本統計量 → 雙樣本t。選擇"每個樣本位于其自身的列",分別選入C1和C2。勾選"置信區間"(默認95%)。根據第3步的結果,勾選"假定等方差"或不勾選。
5 解讀結果
看Session窗口輸出的結果。重點關注兩個值:t值和p值。但說實話,對質量人來說,你只需要盯住p值就夠了。
p值到底怎么讀?一句人話講清楚
很多教材把p值講得云里霧里,我用最直白的方式說:
你的零假設(H?):兩家供應商沒有顯著差異(差異 = 0)。
p值的意思:如果H?是真的(兩家真沒差異),那么我觀察到當前數據(或更極端數據)的概率有多大。
判斷標準:p值越小,說明"沒差異"這個假設越站不住腳。
p值范圍 結論 大白話翻譯 p > 0.05 不拒絕H? 沒證據說兩家有差異,目前看起來差不多 0.01 < p ≤ 0.05 拒絕H? 有差異,但不算特別強烈 p ≤ 0.01 強烈拒絕H? 差異非常顯著,基本可以認定不一樣
回到我們的案例:如果Minitab跑出來p = 0.032(假設)。
因為 0.032 < 0.05,所以結論是:兩家供應商的產品尺寸存在顯著差異。那接下來就要結合均值差和工程判斷——差異方向是什么?幅度多大?對裝配有沒有影響?統計給你的是"有沒有差異",工程判斷給你的是"差異重不重要"。
質量人做假設檢驗的4個常見坑
1 p > 0.05就等于"沒差異"?
不是。p > 0.05只是說"沒有足夠的證據證明有差異",不是說"證明了沒差異"。這是兩碼事。可能只是你的樣本量不夠,檢測不出來。所以正確的說法是"未能拒絕零假設",而不是"接受了零假設"。
2 樣本量太小就做檢驗
你拿5個樣品就去做t檢驗,p值再好看也不可信。為什么?因為樣本量太小,檢驗的"功效"(Power)不夠,容易犯第二類錯誤——明明有差異,你卻沒檢測出來。一般建議每組至少20個以上。
3 只看p值,不看實際差異大小
樣本量足夠大的時候,0.001mm的微小差異也可能得出 p < 0.05。這時候統計上"顯著"了,但工程上根本無所謂。所以一定要看均值差(或置信區間),結合規格公差來判斷,不能只盯著p值。
4 數據不符合正態分布就直接做t檢驗
t檢驗假設數據服從正態分布。如果數據明顯偏態(比如圓度、跳動這類不可能是負值的數據),先做正態性檢驗(Minitab:統計 → 基本統計量 → 正態性檢驗)。如果p < 0.05,數據不正態,應該用非參數檢驗(如Mann-Whitney檢驗),別硬上t檢驗。
總結:假設檢驗的正確打開方式
1 明確業務問題:你想證明什么?比較均值?比較方差?還是比較比率?
2 收集足夠的數據:每組至少20個,隨機抽樣,注意測量系統
3 描述性統計:先"看"數據,了解分布、均值、波動
4 前提驗證:正態性檢驗、方差齊性檢驗
5 執行檢驗:選對方法,跑Minitab
6 結合工程判斷:統計顯著不等于工程重要,要看實際差異大小
核心要點:假設檢驗的關鍵不在Minitab操作,在于"思路"——先搞清楚業務問題,再選對統計方法,最后結合工程判斷下結論。Minitab只是幫你算的那只手,腦子得在你自己身上。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.