機械設計をしているとよく聞く標準偏差という言葉、あまりわかっていませんでした・・・。困ったときにインターネットや書籍で調べてすぐ忘れます。実際にやるときにはエクセル頼みです。
しかし、標準偏差は公差設計、品質管理、実験データー整理などによく使います。
一度理解するのとしていないのとは大違いです。どういう算出方法なのかを理解すれば、自信を持って応用することができます。統計学が苦手な機械設計者の方でもざっくりとは理解しておきたい項目です。
ここでは標準偏差について、その定義と算出方法、意味などを例題を中心にサラッとおさらいしていきます。
標準偏差とは
ざっくりいうと「値のバラつき」のこと
標準偏差とはざっくりいうと「値のバラつき」のことを指します。通常はσ(シグマ)で示されます。
対象の値が正規分布の時に使える
標準偏差はとりうる値が正規分布となるとき、そのバラつきを表すのに使えます。
正規分布をなるべくわかりやすく言い換えてみます。
色々なバラツキを考えた時、バラつき具合がきまった傾向を示す場合があります。目標値や平均値等の数値と実際の値との差が小さい方が出る確率が高く、差が大きいものは出る確率が低くなる場合です。
例えば、テストの点数については、平均点に近くなるほどその点数を取った人数が多くなります。また、日本人の平均身長に近い日本人の方が、平均身長と全然違う日本人の数より多くなります。
さらに例えを使って説明します。
ある加工において$10±0.5$で寸法指示されている場合、実際の加工後の寸法は10.0になるときもあれば、10.1になるときもあるし、9.8になるときもありますよね。
その時、加工では10.0を狙っているわけですから、10.4になる確率より10.1になる確率の方が高い。
これらの確率の違いを正規分布と呼ぶ、というイメージで良いと思います。
色々すっ飛ばしているので、厳密には違う思うのですが、解説しだすと難しすぎてわからなくなります(´;ω;`)。でもここでは正しい意味の理解は不要。調べるとドツボにはまりますので、機械設計者として利用することだけを考えます。
ちなみに、正規分布によらないバラツキとは、例えばサイコロです。サイコロを何千回も振っても、3だけが多く出る、ということはありません(イカサマをしていれば別ですが)。
機械設計者に関わる標準偏差の使用例を並べてみます。
公差設計
部品を組み合わせた時に考えないといけない寸法公差の累積を考える時に使用します。
公差の累積を考えるときは2通りあります。ワーストケースと二乗和平方根(RSS)です。
ワーストケースで設計する場合、一般的に公差が厳しくなりコストアップとなります。そもそもワーストケース=最も悪い組みあわせが発生する確率はかなり低い。この低い確率のものを排除して、品質に問題のない範囲で公差をゆるく設定するのに二乗和平方根(RSS)が使われ、ここに標準偏差がでてきます。
品質管理
品質管理の分野では多用されています。例えば、工程能力指数 $Cp$ を求める際に使います。
工程能力指数は公差の幅 $T$ ( $10±0.05$ なら $T=0.1$ )を標準偏差の6倍で割る事で求めます。
$$Cp = T \div 6 σ $$
$Cp$ は1.00から1.33の間に来るのが良いとのこと。なぜ6倍の標準偏差で割るのか等詳しくは別のウェブサイトを参照ください!
実験データ整理
機械設計者はデータをとることが多いと思いますが、データ整理には統計を多用します。そこに標準偏差はたくさん出てきます。統計をもとにデータ整理を行えば、説得力もアップします。
検定、相関性の確認、偏差値の算出等、詳しくは別のウェブサイト参照です!
標準偏差を求めるには
次に、実際に標準偏差を求めながら用語を確認していきます。
サンプルを集める
まず、バラツキの度合いを求めたいデータを集めます。ここでは寸法のバラつきが正規分布に従うものとして、標準偏差を求めていきます。$10±0.5$で寸法指示されている部品の実際の値をサンプルとして10個用意します。全て$10±0.5$、つまり9.5から10.5の中に値が入っているので、寸法結果は合格です。
サンプル番号 | 測定値 |
1 | 10.1 |
2 | 10.3 |
3 | 9.9 |
4 | 9.6 |
5 | 10.0 |
6 | 10.2 |
7 | 9.8 |
8 | 9.9 |
9 | 10.3 |
10 | 9.7 |
サンプル値を合計し、サンプル数で割る=平均値
サンプルを集め終えたら、サンプルの平均を求めます。
平均を求めるにはサンプル値を合計してサンプル数で割ればオッケーです。
$$(10.1+10.3+9.9+9.6+10.0+10.2+9.8+9.9+10.3+9.7) \div 10 = 9.98$$
一つ一つのサンプルと平均値の差を全て出す=偏差
平均を求めたら、次に偏差を求めます。
偏差は測定値と平均値の差です。先ほど出した平均値から差を求めたものを示します。
サンプル番号 | 測定値 |
偏差(測定値-平均値) |
1 | 10.1 | 0.12 |
2 | 10.3 | 0.32 |
3 | 9.9 | -0.08 |
4 | 9.6 | -0.38 |
5 | 10.0 | 0.02 |
6 | 10.2 | 0.22 |
7 | 9.8 | -0.18 |
8 | 9.9 | -0.08 |
9 | 10.3 | 0.32 |
10 | 9.7 | -0.28 |
その差を二乗する=マイナスを絶対値へ
続いて求めた偏差をすべて二乗します。
なぜ二乗するか、というと、分散を求めるためなのですが、ここではマイナスとなる偏差を打ち消してすべてプラスでの評価をするため、と考えておくと良いと思います。
サンプル番号 | 測定値 |
偏差 |
偏差の二乗 |
1 | 10.1 | 0.12 | 0.0144 |
2 | 10.3 | 0.32 | 0.1024 |
3 | 9.9 | -0.08 | 0.0064 |
4 | 9.6 | -0.38 | 0.1444 |
5 | 10.0 | 0.02 | 0.0004 |
6 | 10.2 | 0.22 | 0.0484 |
7 | 9.8 | -0.18 | 0.0324 |
8 | 9.9 | -0.08 | 0.0064 |
9 | 10.3 | 0.32 | 0.1024 |
10 | 9.7 | -0.28 | 0.0784 |
二乗した物を全て足して、サンプル数で割る=分散
ここで、二乗した数値(=偏差)をすべて足して平均を出します。これを分散と呼びます。
$(0.0144+0.1024+0.0064+0.1444+0.0004+0.0484+0.0324$
$+0.0064+0.1024+0.0784) \div 10 = 0.0536$
分散は値の散らばり具合を表す値、と覚えておけばオッケー。
分散のルートをとる=標準偏差σ
最終仕上げは出た答えのルートをとります。
$\sqrt{0.0536}=0.2315 $
これで標準偏差が求まりました!お疲れ様でした!!
当てはまるパーセントが決まっている(正規分布の場合)
さて、苦労して算出した標準偏差σ(シグマ)ですが、これは下の意味があります。
- 10±σの中に測定結果の68.3%が入る。
- 10±2σの中に測定結果の95.4%が入る。
- 10±3σの中に測定結果の99.7%が入る。
つまり、$10±2σ=10±0.4630$、9.5370から10.4630の間に測定結果の95.4%が入ってくるという事になります。
ちょっと脱線します。
このサンプルの寸法公差ってもともと10±0.5でしたよね!
2σがだいたい0.463ですから、このサンプルデータと同様の加工をすると4.6%くらいは寸法公差ギリギリ、または外れてしまう状態と言えます。あくまで、このサンプルデータの加工が正規分布に従っている時という条件が付きますがね。10個のデータからだけでもここまでわかるのかぁ、と感心してしまいます。
この辺の話は先ほど少しだけ触れた工程能力指数の話になるのですが、統計が専門でないので他サイトさんを参照してください!
標準偏差の意味を理解し、さっさと自動化しよう!
ここまで読み進めていただいた方、標準偏差って大体どんなものなのか理解はできましたかね?
そうしたらすぐエクセルなどで自動化しましょう。
難しい話はいいんです。機械設計者の方はいい製品をいかに安く早く作るかに価値があります。小難しい計算や細かいルールは詳しい人に任せて最高の逸品をお客様へ届けましょう!
まとめ
標準偏差はばらつきです!
一度理解したらエクセル先生に任せましょう!
コメント