Zスコアは、統計学における標準スコアの一種で、個々のデータポイントが平均からどれだけ離れているかを示します。具体的には、データポイントを平均値から引き、その結果を標準偏差で割ることにより計算されます。
z = (X – μ) / σ
ここで、X はデータポイント、μ は平均値、σ は標準偏差です。
Zスコアは、データが平均からどれだけ離れているかを標準偏差の単位で表します。このスコアを使うことで、異なるデータセットや異なる尺度で測定されたデータ間での比較が可能になります。Zスコアが正の場合、データポイントは平均よりも大きいことを意味し、負の場合は平均よりも小さいことを意味します。また、Zスコアが0の場合、そのデータポイントは平均値と同じです。
ExcelでZスコアを計算する方法
1.データの準備
Excelのシートにデータセットを入力します。例えば、B列に「data」というタイトルの下に各データポイント(スコア)を入力します。
2.平均値と標準偏差の計算
データセットの平均値を計算するために、空いているセルに=AVERAGE(B2:B16)と入力します。ここでB2:B16は、データが入力されているセル範囲を指します。
データセットの標準偏差を計算するために、別の空いているセルに=STDEV.P(B2:B16)と入力します。これはサンプル標準偏差を計算します。全体母集団の標準偏差を計算する場合は、=STDEV.P(…)を使用します。
4.Zスコアの計算
各データポイントのZスコアを計算するために、データセットの隣の列(例: C列)に以下の式を入力します。=(B2 – [平均値のセル]) / [標準偏差のセル]。ここで、[平均値のセル]と[標準偏差のセル]は、ステップ2とステップ3で計算した平均値と標準偏差が入力されたセルを指します。この式を各データポイントに対して適用します。
5.Zスコアのコピーと貼り付け
最初に計算したZスコアの式をコピーし、他のすべてのデータポイントに対して貼り付けます。これにより、各データポイントのZスコアが計算されます。
6.グラフ化
A列とC列を選択しグラフ化をします。
視覚化することでデータの平均より大きい値が顕在化させることができます。
まとめ
Zスコアはデータ内の異常値や外れ値を特定するのに役立ちます。Zスコアが非常に大きいまたは小さいデータポイント(例えば、+3や-3を超える値)は、平均から大きく離れており、潜在的な異常値と見なされることがあります。
■.ダウンロードサービスのご案内
本記事で使用しているサンプルExcelbookです。
注意:本記事の内容に関して運用した結果の影響については責任を負いかねます。あらかじめご了承ください。