多重共線性(定義、タイプ)| 説明付きの上位3つの例

多重共線性とは何ですか?

多重共線性は、回帰モデルの2つ以上の変数が他の変数に依存しているため、一方が他方から高精度で線形に予測できる統計現象です。これは一般的に観察研究で使用され、実験研究ではあまり一般的ではありません。

多重共線性の種類

多重共線性には4つのタイプがあります

  • #1 -パーフェクト多重共-式の独立変数は、完璧な線形関係を予測するとき、それは存在しています。
  • #2 –高い多重線性–相互に完全に相関していない2つ以上の独立変数間の線形関係を指します。
  • #3 –構造的多重共線性–これは、方程式にさまざまな独立変数を挿入することにより、研究者自身が引き起こします。
  • #4 –データベースのMulticollineaarity –それは研究者によって不十分に設計された実験によって引き起こされます。

多重共線性の原因

独立変数、変数のパラメーターの変更は、変数のわずかな変更が結果に大きな影響を与えることを行います。データ収集は、選択された母集団のサンプルを参照します。

多重共線性の例

例1

ABC Ltd a KPOが製薬会社に雇われて、インドの病気に関する研究サービスと統計分析を提供するとします。このため、ABC ltdは、年齢、体重、職業、身長、健康状態を一応のパラメーターとして選択しました。

  • 上記の例では、調査用に選択された独立変数が結果に直接相関しているため、多重共線性の状況があります。したがって、ここで選択された変数のために結果が直接影響を受けるため、プロジェクトを開始する前に、研究者が最初に変数を調整することをお勧めします。

例2

タタモーターズが市場のどのカテゴリーでタタモーターズの販売量が多いかを理解するために、ABCLtdがタタモーターズから任命されたとしましょう。

  • 上記の例では、最初に独立変数が確定され、それに基づいて調査を完了する必要があります。それは月収、年齢である可能性があります。ブランド、下層階級。これは、他の車を見なくてもこの車(tata nano)を購入できる人の数を把握するために、これらすべてのタブに収まるデータが選択されることを意味します。

例3

ABC Ltdが、心臓発作を起こしやすい50歳未満の人の数を知るためのレポートを提出するために雇われていると仮定しましょう。このためのパラメータは、年齢、性別、病歴​​です

  • 上記の例では、50歳以上の人が自動的にフィルタリングされるように、一般からのアプリケーションを招待するために独立変数「年齢」を50歳未満に調整する必要があるために発生した多重共線性があります。

利点

以下はいくつかの利点です

  • 方程式の独立変数間の線形関係。
  • 調査ベースの企業が作成した統計モデルや調査レポートで非常に役立ちます。
  • 望ましい結果への直接的な影響。

短所

以下はいくつかのデメリットです

  • 状況によっては、変数に関するデータをさらに収集することで、この問題が解決される場合があります。
  • ダミー変数の誤った使用、つまり研究者は必要なときにいつでもダミー変数の使用を忘れる可能性があります。
  • 重みのkgとlbsのような2つの同じまたは同一の変数を方程式に挿入します。
  • 2の組み合わせである方程式に変数を挿入します。
  • これは統計手法であり、実行には統計計算機が必要なため、計算の実行が複雑になります。

結論

多重共線性は、大規模なデータベースと目的の出力の回帰分析と統計分析でよく使用される最も好まれる統計ツールの1つです。すべての主要企業は、経営陣に市場の戦略的見解を提供し、このことを念頭に置いて長期戦略を立案するのを支援するために、製品または人に関する統計回帰分析を実行する独立した統計部門を社内に持っています。分析のグラフィック表示により、読者は直接の関係、正確性、およびパフォーマンスを明確に把握できます。

  • 研究者の目標が方程式の独立変数を理解することである場合、多重共線性は彼にとって大きな問題になります。
  • 研究者は、ステージ0自体で変数に必要な変更を加える必要があります。そうしないと、結果に大きな影響を与える可能性があります。
  • 多重共線性は、相関行列を調べることで実行できます。
  • 多重共線性の問題を解決するには、是正措置が重要な役割を果たします。