認識一個在沖壓車間做質量的朋友,入職第一年,每次月報他都把測量數據原原本本粘到Excel里,然后手動數"超差的有幾個",算出來一個百分比就交上去了。
有一天質量總監問他:這批數據的均值在哪里?分散程度怎么樣?跟規格中心偏了多少?趨勢是在變好還是變壞?
他回答不出來。
后來他跟我說:那一刻他才明白,把數據記錄下來只是第一步,能看懂數據背后說的是什么,才是質量工程師該做的事。
這篇不講理論,只講在Excel里怎么做——最常用的基礎統計指標,一步一步來,結合質量人最熟悉的場景。
一、你為什么要學數據分析?先把這個問題想清楚
不是為了考證,是為了解決問題
質量工作里,數據無處不在:尺寸測量數據、硬度檢測數據、扭矩測試數據、客戶投訴數量、不良率統計……每天都在產生。
但很多質量人對數據的處理,就停留在"記錄下來+算個百分比"這個層級。這沒什么問題,但能做到的事情太有限了。
學一點基礎統計分析之后,你能做到的事情會大不一樣:
1
看出數據有沒有"漂移"——尺寸均值悄悄偏向規格上限,良率還沒掉但危險信號已經出現,你能提前發現
2
量化過程穩定性——用Cpk告訴工廠老板"這道工序的過程能力還差多少",比"良率還可以"有說服力一百倍
3
找出問題的根源——兩條生產線的同一工序,不良率差了3倍,用數據分析可以快速鎖定是哪個參數出了差異
4
讓改善結果有數據支撐——改善前后的數據對比,才是真正的效果證明,不是靠"感覺好多了"
今天這篇,就從Excel里最常用的幾個統計函數開始,一步一步來。
二、第一步:描述性統計——了解數據"長什么樣"
均值、標準差、極差、中位數——四個指標先搞懂
我們用一個具體例子來說:某沖壓件的孔徑尺寸,規格是 Φ10.00 ± 0.05 mm,抽取了20個樣品測量,數據如下(單位mm):
10.02, 9.98, 10.01, 10.04, 9.97, 10.03, 10.00, 9.99, 10.02, 10.05,
9.96, 10.01, 10.03, 9.98, 10.02, 10.04, 9.99, 10.01, 10.03, 10.02
把這20個數據放進Excel的A列(A1:A20),然后我們用函數一個一個算出來:
統計指標 Excel公式 結果(示例) 含義解讀 均值 Mean =AVERAGE(A1:A20) 10.010 數據的集中趨勢,均值偏離名義尺寸10.00說明過程有系統偏移 標準差 Stdev =STDEV(A1:A20) 0.022 數據的分散程度,值越大說明過程波動越大 最大值 Max =MAX(A1:A20) 10.05 最大值,對照規格上限10.05,剛好在邊界 最小值 Min =MIN(A1:A20) 9.96 最小值,規格下限9.95,距離下限只剩0.01 極差 Range =MAX(A1:A20)-MIN(A1:A20) 0.09 最大值與最小值之差,規格范圍0.10,極差0.09說明過程空間所剩無幾 中位數 Median =MEDIAN(A1:A20) 10.015 中間值,與均值對比可判斷數據是否有偏斜 樣本數量 Count =COUNT(A1:A20) 20 確認數據量,排查有無遺漏或錄入錯誤
關于 STDEV 和 STDEVP 的區別
Excel里有兩個標準差函數:STDEV(樣本標準差,分母是n-1)和STDEVP(總體標準差,分母是n)。質量分析中,抽樣檢驗用的都是樣本數據,用 STDEV 就對了。只有你分析的是全量數據(比如一整批100%全檢的數據),才用STDEVP。
把這幾個函數的結果匯成一個小表,貼在數據旁邊,一眼就能看出這批數據的"畫像"。不需要看每一個數字,描述性統計告訴你全局。
三、第二步:過程能力指數——用Cpk告訴老板"夠不夠穩"
Cp和Cpk是質量工程師的核心語言,Excel里5行搞定
描述性統計告訴你數據"現在在哪",過程能力指數告訴你數據"和規格要求比起來怎么樣"。
先說定義,不廢話:
Cp(過程能力指數)——只看分散程度,不管均值偏不偏
公式:Cp = (USL - LSL) / (6 × σ)
USL=規格上限,LSL=規格下限,σ=標準差。Cp≥1.33算合格,≥1.67更好。
Cpk(修正的過程能力指數)——既看分散,也看均值是否偏離中心
公式:Cpk = MIN[(USL - Mean) / (3σ), (Mean - LSL) / (3σ)]
取兩個值中較小的那個。Cpk才是真正反映實際過程能力的指標。
還是用上面的沖壓件數據,規格USL=10.05,LSL=9.95,均值Mean=10.010,標準差σ=0.022,在Excel里這樣寫:
單元格 內容 公式 D1 規格上限 USL 10.05(直接輸入) D2 規格下限 LSL 9.95(直接輸入) D3 均值 Mean =AVERAGE(A1:A20) D4 標準差 σ =STDEV(A1:A20) D5 Cp =(D1-D2)/(6*D4) D6 Cpk =MIN((D1-D3)/(3*D4),(D3-D2)/(3*D4))
用這批數據算出來:Cp ≈ 0.76,Cpk ≈ 0.61。
?? 結果解讀:Cpk = 0.61,這個過程能力非常不足。行業標準要求Cpk≥1.33(一般要求),特殊特性要求Cpk≥1.67。0.61意味著當前過程的不良率估計在5%以上,靠抽檢根本兜不住,必須從根本上提升過程能力。
Cpk值范圍 判定結論 處理建議 Cpk < 1.00 過程能力嚴重不足 必須改善,不能依賴檢驗,需找根因提升能力 1.00 ≤ Cpk < 1.33 過程能力不足,風險較高 需要加強控制措施,列入改善計劃 1.33 ≤ Cpk < 1.67 過程能力滿足一般要求 繼續監控,維持現有控制措施 Cpk ≥ 1.67 過程能力優秀(CC/SC要求) 可適當降低檢驗頻次,保持監控
四、第三步:直方圖——把數據分布畫出來看
均值和標準差是數字,直方圖讓你"看見"數據的真實形狀
光有均值和標準差,還不夠直觀。有時候數據的分布不是正態的——可能是雙峰(兩個批次混在一起)、可能是右偏(少數超大值把均值拉偏)、可能是截斷(接近下限的數據異常少,可能有人在"幫助"數據)。
這些問題,只看均值和標準差是看不出來的,要畫直方圖。
Excel直方圖三步法:
1
設定分箱邊界(Bin)
在E列輸入區間邊界,比如:9.94, 9.96, 9.98, 10.00, 10.02, 10.04, 10.06。分箱間距建議取 極差/10 左右,太細看不出趨勢,太粗丟失細節。
2
用COUNTIFS統計每個區間的頻數
在F列用 =COUNTIFS(A:A,">"&E1,A:A,"<="&E2) 統計每個區間的數據個數,向下拖拉填充所有行。
3
選中頻數數據,插入柱狀圖
選中E列和F列的數據區域,插入→圖表→柱形圖。右鍵圖表→設置數據系列格式→間距寬度調為0,柱子就緊挨在一起,變成直方圖的樣子。最后在圖表上加兩條垂直線標注規格上下限(USL/LSL),直觀對比。
? Excel 2019及以上版本的快捷方法
新版Excel直接支持直方圖圖表類型:選中數據列→插入→圖表→所有圖表→直方圖。Excel會自動計算分箱。右鍵X軸→設置坐標軸格式,可以手動調整"箱寬度"。省去手動設定Bin邊界的步驟。
五、第四步:趨勢圖——時間序列看過程是否"在漂移"
均值穩不穩,靠趨勢圖說話
有個場景非常典型:前10個班次的孔徑均值是10.005,后10個班次的均值悄悄漲到10.025。單看總體Cpk還湊合,但趨勢圖一畫出來,問題一目了然——均值在持續往上漂。這是刀具磨損或模具磨損的典型信號。
做法很簡單:
1
B列放時間(班次序號或日期),A列放對應的測量值(或每班均值)
2
選中B列+A列→插入→折線圖,X軸是時間,Y軸是測量值
3
在圖表上添加兩條水平輔助線標注USL和LSL(用系列數據法:新增一列全為10.05,另一列全為9.95,加入圖表作為參考線)
4
點擊趨勢線→添加趨勢線→線性,看是否有明顯的上升或下降斜率
趨勢圖的核心價值:靜態統計(Cpk)反映的是歷史水平的快照,趨勢圖反映的是過程隨時間的動態變化。兩者結合才完整。Cpk合格但趨勢圖顯示均值持續漂移,是比Cpk不合格更危險的信號——因為你知道下一步會超差,但你還沒到。
六、第五步:帕累托圖——用20%的原因解決80%的問題
不良模式有多少種?哪種最該先解決?帕累托告訴你
帕累托分析是質量工作里使用頻率最高的工具之一。原理很簡單:把問題按頻次從高到低排列,加上累計百分比,你就能看出哪幾類問題占了總不良的80%。
舉個例子:某車間上月共發生520件不良品,不良模式統計如下:
不良類型 數量(件) 占比 累計占比 尺寸超差 210 40.4% 40.4% 表面劃傷 156 30.0% 70.4% 焊接氣孔 62 11.9% 82.3% 毛刺 48 9.2% 91.5% 其他 44 8.5% 100%
從表里可以看出:只要把"尺寸超差"和"表面劃傷"這兩類問題解決掉,就能消除70%的不良。這就是資源應該優先投入的方向。
Excel畫帕累托圖的方法:
1
A列放不良類型,B列放數量(已從大到小排序),C列用公式計算累計占比:=SUM($B$1:B1)/SUM($B$1:$B$5)
2
選中A、B、C三列→插入→組合圖(柱形圖+折線圖)。B列數量用柱形圖(主軸),C列累計占比用折線圖(次軸)
3
次軸(右側Y軸)范圍設為0%~100%,在80%處加一條輔助參考線,帕累托圖就完成了
七、條件統計——COUNTIF/SUMIF/AVERAGEIF,日常用最多的三個
按條件統計,是質量月報的核心操作
日常質量報表里,最頻繁的操作是"按條件統計":統計某條生產線的不良數、某型號產品的不良率、某類問題的發生次數……這三個函數滿足90%的場景:
函數 用途 質量場景示例 寫法示例 COUNTIF 按條件計數 統計A線的不良件數 =COUNTIF(B:B,"A線") COUNTIFS 多條件計數 統計5月份A線的尺寸超差件數 =COUNTIFS(B:B,"A線",C:C,"5月",D:D,"尺寸超差") SUMIF 按條件求和 統計尺寸超差的報廢成本合計 =SUMIF(D:D,"尺寸超差",E:E) AVERAGEIF 按條件求均值 計算B線的平均日不良率 =AVERAGEIF(B:B,"B線",F:F) COUNTIF 統計超規格數量 統計孔徑超過上限10.05的件數 =COUNTIF(A:A,">"&10.05)
? 不良率的計算公式:
=COUNTIFS(條件區域,條件)/COUNTA(檢驗件號列)
或者更簡潔:=不良件數/總檢驗件數,格式設為百分比。如果要算PPM,再乘以1,000,000即可。
八、數據分析的幾個常見坑
技術會了,這些認知坑也別踩
五個高頻認知坑
坑一:樣本量太小,結論不可信。20個樣本算出來Cpk=1.40,就認為過程沒問題——這個結論的置信度很低。Cpk分析通常建議樣本量≥100,至少≥50。樣本量小的時候,Cpk會有很大的不確定性。
坑二:數據不是正態分布,Cpk失效。Cpk的計算假設數據服從正態分布。如果數據明顯雙峰、截斷或偏斜,Cpk算出來是不準確的,需要先用正態性檢驗(或者看直方圖形狀)判斷。
坑三:把均值當作"過程中心"。均值只代表數據集中趨勢,不代表過程穩定。均值在規格中間但數據分散很大,Cpk依然很低。要結合標準差才能完整判斷。
坑四:用頻率代替概率。20個數據里有1個超差,不代表不良率是5%。樣本量太小,頻率波動極大,不足以推斷總體概率,要有這個意識。
坑五:數據錄入有誤差,分析白做。測量儀器未校準、操作工測量手法不一致、數據手工抄錄錯誤——這些問題在源頭上會讓所有分析失效。做數據分析之前,先確認數據質量本身沒問題(MSA通過、錄入流程受控)。
寫在最后:數據分析是質量工程師的核心競爭力
不是為了炫技,是為了做出更好的判斷
很多質量人問我:我不懂統計學,能做好質量工作嗎?
我的答案是:基礎統計你一定要懂,不是深,而是扎實。均值、標準差、Cpk、直方圖、趨勢圖、帕累托——這六樣東西搞清楚了,能解決80%的日常數據分析場景。
Minitab比Excel更專業,但大多數企業的質量人還在用Excel。先把Excel里能做到的事情做扎實,才有資格談更復雜的工具。
數據不會騙人,但解讀數據的人會犯錯。學好統計分析,不是為了算出一個數字交差,而是為了在這個數字背后看出過程在告訴你什么,然后做出更好的決策。
本文Excel操作速查
描述性統計:AVERAGE / STDEV / MAX / MIN / MEDIAN / COUNT
過程能力:Cp = (USL-LSL)/(6σ);Cpk = MIN((USL-μ)/3σ, (μ-LSL)/3σ)
直方圖:COUNTIFS分箱統計 → 柱形圖 → 間距設0
趨勢圖:折線圖 + 添加趨勢線 + USL/LSL參考線
帕累托:數量從大到小排序 → CUMSUM累計占比 → 組合圖(柱+折線)
條件統計:COUNTIF / COUNTIFS / SUMIF / AVERAGEIF
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.