網易首頁 > 網易號 > 正文申請入駐

質量數據分析入門用Excel做基礎統計，沒那么難

2026-05-22 07:10:55　來源: 敖博管理

上海舉報

分享至

認識一個在沖壓車間做質量的朋友，入職第一年，每次月報他都把測量數據原原本本粘到Excel里，然后手動數"超差的有幾個"，算出來一個百分比就交上去了。

有一天質量總監問他：這批數據的均值在哪里？分散程度怎么樣？跟規格中心偏了多少？趨勢是在變好還是變壞？

他回答不出來。

后來他跟我說：那一刻他才明白，把數據記錄下來只是第一步，能看懂數據背后說的是什么，才是質量工程師該做的事。

這篇不講理論，只講在Excel里怎么做——最常用的基礎統計指標，一步一步來，結合質量人最熟悉的場景。

一、你為什么要學數據分析？先把這個問題想清楚

不是為了考證，是為了解決問題

質量工作里，數據無處不在：尺寸測量數據、硬度檢測數據、扭矩測試數據、客戶投訴數量、不良率統計……每天都在產生。

但很多質量人對數據的處理，就停留在"記錄下來+算個百分比"這個層級。這沒什么問題，但能做到的事情太有限了。

學一點基礎統計分析之后，你能做到的事情會大不一樣：

看出數據有沒有"漂移"——尺寸均值悄悄偏向規格上限，良率還沒掉但危險信號已經出現，你能提前發現

量化過程穩定性——用Cpk告訴工廠老板"這道工序的過程能力還差多少"，比"良率還可以"有說服力一百倍

找出問題的根源——兩條生產線的同一工序，不良率差了3倍，用數據分析可以快速鎖定是哪個參數出了差異

讓改善結果有數據支撐——改善前后的數據對比，才是真正的效果證明，不是靠"感覺好多了"

今天這篇，就從Excel里最常用的幾個統計函數開始，一步一步來。

二、第一步：描述性統計——了解數據"長什么樣"

均值、標準差、極差、中位數——四個指標先搞懂

我們用一個具體例子來說：某沖壓件的孔徑尺寸，規格是 Φ10.00 ± 0.05 mm，抽取了20個樣品測量，數據如下（單位mm）：

10.02, 9.98, 10.01, 10.04, 9.97, 10.03, 10.00, 9.99, 10.02, 10.05,
9.96, 10.01, 10.03, 9.98, 10.02, 10.04, 9.99, 10.01, 10.03, 10.02

把這20個數據放進Excel的A列（A1:A20），然后我們用函數一個一個算出來：

統計指標 Excel公式結果（示例）含義解讀 均值 Mean =AVERAGE(A1:A20) 10.010 數據的集中趨勢，均值偏離名義尺寸10.00說明過程有系統偏移 標準差 Stdev =STDEV(A1:A20) 0.022 數據的分散程度，值越大說明過程波動越大 最大值 Max =MAX(A1:A20) 10.05 最大值，對照規格上限10.05，剛好在邊界 最小值 Min =MIN(A1:A20) 9.96 最小值，規格下限9.95，距離下限只剩0.01 極差 Range =MAX(A1:A20)-MIN(A1:A20) 0.09 最大值與最小值之差，規格范圍0.10，極差0.09說明過程空間所剩無幾 中位數 Median =MEDIAN(A1:A20) 10.015 中間值，與均值對比可判斷數據是否有偏斜 樣本數量 Count =COUNT(A1:A20) 20 確認數據量，排查有無遺漏或錄入錯誤

關于 STDEV 和 STDEVP 的區別

Excel里有兩個標準差函數：STDEV（樣本標準差，分母是n-1）和STDEVP（總體標準差，分母是n）。質量分析中，抽樣檢驗用的都是樣本數據，用 STDEV 就對了。只有你分析的是全量數據（比如一整批100%全檢的數據），才用STDEVP。

把這幾個函數的結果匯成一個小表，貼在數據旁邊，一眼就能看出這批數據的"畫像"。不需要看每一個數字，描述性統計告訴你全局。

三、第二步：過程能力指數——用Cpk告訴老板"夠不夠穩"

Cp和Cpk是質量工程師的核心語言，Excel里5行搞定

描述性統計告訴你數據"現在在哪"，過程能力指數告訴你數據"和規格要求比起來怎么樣"。

先說定義，不廢話：

Cp（過程能力指數）——只看分散程度，不管均值偏不偏
公式：Cp = (USL - LSL) / (6 × σ)
USL=規格上限，LSL=規格下限，σ=標準差。Cp≥1.33算合格，≥1.67更好。

Cpk（修正的過程能力指數）——既看分散，也看均值是否偏離中心
公式：Cpk = MIN[(USL - Mean) / (3σ), (Mean - LSL) / (3σ)]
取兩個值中較小的那個。Cpk才是真正反映實際過程能力的指標。

還是用上面的沖壓件數據，規格USL=10.05，LSL=9.95，均值Mean=10.010，標準差σ=0.022，在Excel里這樣寫：

單元格內容公式 D1 規格上限 USL 10.05（直接輸入） D2 規格下限 LSL 9.95（直接輸入） D3 均值 Mean =AVERAGE(A1:A20) D4 標準差 σ =STDEV(A1:A20) D5 Cp =(D1-D2)/(6*D4) D6 Cpk =MIN((D1-D3)/(3*D4),(D3-D2)/(3*D4))

用這批數據算出來：Cp ≈ 0.76，Cpk ≈ 0.61。

?? 結果解讀：Cpk = 0.61，這個過程能力非常不足。行業標準要求Cpk≥1.33（一般要求），特殊特性要求Cpk≥1.67。0.61意味著當前過程的不良率估計在5%以上，靠抽檢根本兜不住，必須從根本上提升過程能力。

Cpk值范圍判定結論處理建議 Cpk < 1.00 過程能力嚴重不足必須改善，不能依賴檢驗，需找根因提升能力 1.00 ≤ Cpk < 1.33 過程能力不足，風險較高需要加強控制措施，列入改善計劃 1.33 ≤ Cpk < 1.67 過程能力滿足一般要求繼續監控，維持現有控制措施 Cpk ≥ 1.67 過程能力優秀（CC/SC要求）可適當降低檢驗頻次，保持監控

四、第三步：直方圖——把數據分布畫出來看

均值和標準差是數字，直方圖讓你"看見"數據的真實形狀

光有均值和標準差，還不夠直觀。有時候數據的分布不是正態的——可能是雙峰（兩個批次混在一起）、可能是右偏（少數超大值把均值拉偏）、可能是截斷（接近下限的數據異常少，可能有人在"幫助"數據）。

這些問題，只看均值和標準差是看不出來的，要畫直方圖。

Excel直方圖三步法：

設定分箱邊界（Bin）

在E列輸入區間邊界，比如：9.94, 9.96, 9.98, 10.00, 10.02, 10.04, 10.06。分箱間距建議取極差/10 左右，太細看不出趨勢，太粗丟失細節。

用COUNTIFS統計每個區間的頻數

在F列用 =COUNTIFS(A:A,">"&E1,A:A,"<="&E2) 統計每個區間的數據個數，向下拖拉填充所有行。

選中頻數數據，插入柱狀圖

選中E列和F列的數據區域，插入→圖表→柱形圖。右鍵圖表→設置數據系列格式→間距寬度調為0，柱子就緊挨在一起，變成直方圖的樣子。最后在圖表上加兩條垂直線標注規格上下限（USL/LSL），直觀對比。

? Excel 2019及以上版本的快捷方法

新版Excel直接支持直方圖圖表類型：選中數據列→插入→圖表→所有圖表→直方圖。Excel會自動計算分箱。右鍵X軸→設置坐標軸格式，可以手動調整"箱寬度"。省去手動設定Bin邊界的步驟。

五、第四步：趨勢圖——時間序列看過程是否"在漂移"

均值穩不穩，靠趨勢圖說話

有個場景非常典型：前10個班次的孔徑均值是10.005，后10個班次的均值悄悄漲到10.025。單看總體Cpk還湊合，但趨勢圖一畫出來，問題一目了然——均值在持續往上漂。這是刀具磨損或模具磨損的典型信號。

做法很簡單：

B列放時間（班次序號或日期），A列放對應的測量值（或每班均值）

選中B列+A列→插入→折線圖，X軸是時間，Y軸是測量值

在圖表上添加兩條水平輔助線標注USL和LSL（用系列數據法：新增一列全為10.05，另一列全為9.95，加入圖表作為參考線）

點擊趨勢線→添加趨勢線→線性，看是否有明顯的上升或下降斜率

趨勢圖的核心價值：靜態統計（Cpk）反映的是歷史水平的快照，趨勢圖反映的是過程隨時間的動態變化。兩者結合才完整。Cpk合格但趨勢圖顯示均值持續漂移，是比Cpk不合格更危險的信號——因為你知道下一步會超差，但你還沒到。

六、第五步：帕累托圖——用20%的原因解決80%的問題

不良模式有多少種？哪種最該先解決？帕累托告訴你

帕累托分析是質量工作里使用頻率最高的工具之一。原理很簡單：把問題按頻次從高到低排列，加上累計百分比，你就能看出哪幾類問題占了總不良的80%。

舉個例子：某車間上月共發生520件不良品，不良模式統計如下：

不良類型數量（件）占比累計占比尺寸超差 210 40.4% 40.4% 表面劃傷 156 30.0% 70.4% 焊接氣孔 62 11.9% 82.3% 毛刺 48 9.2% 91.5% 其他 44 8.5% 100%

從表里可以看出：只要把"尺寸超差"和"表面劃傷"這兩類問題解決掉，就能消除70%的不良。這就是資源應該優先投入的方向。

Excel畫帕累托圖的方法：

A列放不良類型，B列放數量（已從大到小排序），C列用公式計算累計占比：=SUM($B$1:B1)/SUM($B$1:$B$5)

選中A、B、C三列→插入→組合圖（柱形圖+折線圖）。B列數量用柱形圖（主軸），C列累計占比用折線圖（次軸）

次軸（右側Y軸）范圍設為0%~100%，在80%處加一條輔助參考線，帕累托圖就完成了

七、條件統計——COUNTIF/SUMIF/AVERAGEIF，日常用最多的三個

按條件統計，是質量月報的核心操作

日常質量報表里，最頻繁的操作是"按條件統計"：統計某條生產線的不良數、某型號產品的不良率、某類問題的發生次數……這三個函數滿足90%的場景：

函數用途質量場景示例寫法示例 COUNTIF 按條件計數統計A線的不良件數 =COUNTIF(B:B,"A線") COUNTIFS 多條件計數統計5月份A線的尺寸超差件數 =COUNTIFS(B:B,"A線",C:C,"5月",D:D,"尺寸超差") SUMIF 按條件求和統計尺寸超差的報廢成本合計 =SUMIF(D:D,"尺寸超差",E:E) AVERAGEIF 按條件求均值計算B線的平均日不良率 =AVERAGEIF(B:B,"B線",F:F) COUNTIF 統計超規格數量統計孔徑超過上限10.05的件數 =COUNTIF(A:A,">"&10.05)

? 不良率的計算公式：
=COUNTIFS(條件區域,條件)/COUNTA(檢驗件號列)
或者更簡潔：=不良件數/總檢驗件數，格式設為百分比。如果要算PPM，再乘以1,000,000即可。

八、數據分析的幾個常見坑

技術會了，這些認知坑也別踩

五個高頻認知坑

坑一：樣本量太小，結論不可信。20個樣本算出來Cpk=1.40，就認為過程沒問題——這個結論的置信度很低。Cpk分析通常建議樣本量≥100，至少≥50。樣本量小的時候，Cpk會有很大的不確定性。

坑二：數據不是正態分布，Cpk失效。Cpk的計算假設數據服從正態分布。如果數據明顯雙峰、截斷或偏斜，Cpk算出來是不準確的，需要先用正態性檢驗（或者看直方圖形狀）判斷。

坑三：把均值當作"過程中心"。均值只代表數據集中趨勢，不代表過程穩定。均值在規格中間但數據分散很大，Cpk依然很低。要結合標準差才能完整判斷。

坑四：用頻率代替概率。20個數據里有1個超差，不代表不良率是5%。樣本量太小，頻率波動極大，不足以推斷總體概率，要有這個意識。

坑五：數據錄入有誤差，分析白做。測量儀器未校準、操作工測量手法不一致、數據手工抄錄錯誤——這些問題在源頭上會讓所有分析失效。做數據分析之前，先確認數據質量本身沒問題（MSA通過、錄入流程受控）。

寫在最后：數據分析是質量工程師的核心競爭力

不是為了炫技，是為了做出更好的判斷

很多質量人問我：我不懂統計學，能做好質量工作嗎？

我的答案是：基礎統計你一定要懂，不是深，而是扎實。均值、標準差、Cpk、直方圖、趨勢圖、帕累托——這六樣東西搞清楚了，能解決80%的日常數據分析場景。

Minitab比Excel更專業，但大多數企業的質量人還在用Excel。先把Excel里能做到的事情做扎實，才有資格談更復雜的工具。

數據不會騙人，但解讀數據的人會犯錯。學好統計分析，不是為了算出一個數字交差，而是為了在這個數字背后看出過程在告訴你什么，然后做出更好的決策。

本文Excel操作速查
描述性統計：AVERAGE / STDEV / MAX / MIN / MEDIAN / COUNT
過程能力：Cp = (USL-LSL)/(6σ)；Cpk = MIN((USL-μ)/3σ, (μ-LSL)/3σ)
直方圖：COUNTIFS分箱統計 → 柱形圖 → 間距設0
趨勢圖：折線圖 + 添加趨勢線 + USL/LSL參考線
帕累托：數量從大到小排序 → CUMSUM累計占比 → 組合圖（柱+折線）
條件統計：COUNTIF / COUNTIFS / SUMIF / AVERAGEIF

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.