平均vs中央値| 統計で使用するメソッド間の違い

平均と中央値の違い

平均と中央値は数学で一般的に使用される2つの用語です。平均は特定の数値の平均のようなもので、数値を合計して数値の数で割ると平均が得られますが、中央値は全体の中間の数値を返します。データセットであり、データセットが偶数の場合、中央値は2つの中間の数値を加算し、それを2で除算して中央値を求めます。

これらは中心傾向の尺度であり、分析を行って結果を解釈する必要がある大規模なデータセットの測定によく使用されます。平均、中央値、最頻値は、データが平均または平均からの分散であることを示す平均の3つの尺度です。これらの方法は統計で広く使用されていますが、データの平均値は3つの方法の中で最も広く使用されている方法です。

意味は何?

平均は、配列内の観測数の単純な合計を観測数で割ったものです。たとえば、5人で構成されるグループの平均身長または平均身長について話す場合。平均身長は、5人の身長を人数で割ったもの、つまり5人で計算されます。

平均式=(すべての観測値の合計/観測値の数)

中央値は何ですか?

一方、中央値は、データ配列の上位セットを下位セットから分離するデータ配列セットの中央値です。データの中央値を計算するには、最初にデータを昇順で並べる必要があります。データセットにカーディナリティがある場合、データセットの中央の2つの数値の平均をとる必要があります。ただし、これら2つの方法は同じ意味で使用されることがよくあります。

中央値式=(n + 1)/ 2

nが奇数の場合

中央値= [(n / 2)+ {(n / 2)+1}] / 2

nが偶数の場合

平均と中央値のインフォグラフィック

平均と中央値の主な違いを見てみましょう。

主な違いの平均と中央値

  • 平均は、使用と適用が簡単で、偶数か奇数かに関係なく、任意のデータ配列セットに適用できます。一方、中央値の使用は少し複雑であり、計算する前に、データセットを最初に昇順または降順で配置する必要があります。
  • 平均は通常、正規分布に使用されますが、中央値は偏った分布のデータセットに使用されます。
  • 平均は単純ですが、分布に外れ値が含まれている可能性があり、ユーザーに解釈のための正しい結果を提供できない場合があるため、堅牢ではありません。一方、中央値法は堅牢であり、日付セットの中心傾向を導出するために偏った分布に使用されるため、使用に適しています。平均値と比較した場合、ユーザーは多くの正確な結果を得ることができます。
  • すべての観測値の合計を観測値の数で割った平均の式は1つだけです。一方、中央値には2つの数式があり、データセットの中央値だけが中央値になる奇数の1つです。しかし、偶数のデータセットがある場合、2つの値の中央値が選択され、2で除算されます。これにより、偶数のデータセットの中央値が得られます。

平均と中央値の比較表

平均中央値
平均は、データ配列内のすべての値を合計し、それを観測数で割ることによって計算されます。中央値は、データセットの正確な中間値です。これは、データセットを昇順で配置し、データセットから中間値を見つけるか選択することで計算できます。
平均の計算が簡単なため、業界でより広く使用されており、迅速な数値が得られます業界ではあまり使用されていませんが、単純な数値の合計である平均よりも完全で正確です。
これは通常、正規分布のデータセットに使用されます。データに大きな歪度がある場合、またはデータのテールが長い場合に、データセットを記述すると特に便利です。これは、アウトラインがデータに大きな重みを持っている場合に広く使用されています。つまり、適切な計算方法ではありません。
中心傾向を導出するための計算のための堅牢なツールではありませんこれは、データ内の重みを決定するため、非常に堅牢なツールです。これは、通常、長いテールで高い重みです。
外れ値に非常に敏感です外れ値の影響ははるかに少ない
使い方は簡単ですそれは本質的に複雑です
値を合計できないため、カテゴリデータに対して計算することはできません。論理的に順序付けできないため、分類された名目データでは識別できません。

結論

平均と中央値とは別に、モードである中心傾向を測定するためによく使用されるもう1つの方法があります。モードはデータセットで最も頻繁に発生する値であり、モードには、数値データセットと分類されたデータセットの両方で見つけることができるという平均と中央値よりも優れています。

モードが存在し、平均に対するより良い結果と分析の優位性の中央値にもかかわらず、特にデータセットが正規分布であり、データが通常歪んでいる場合、平均は依然として中心傾向の最も適切な尺度です。

優れた分析者として、中心傾向は3つのデータ方法すべてで測定する必要があり、分析の分散を熟考して注意深く分析し、データセットでより適切で正確な結果を生成する必要があります。