P344 マハラノビス予測プログラム        
このマハラノビス予測プログラムは、多変量データにおいて、基準データのマハラノ距離から、
予測データのマハラノ距離を計算し、どのデータが外れ値になるかを予測するときに使用します。
サンプルデータとその解法は以下のとおりです。
データ マハラノ距離結果
基準データ Q1 Q2 Q3 Q4 A 1.62
A 13 11 5 3 B 0.628
B 13 9 3 5 C 0.141
C 16 10 4 8 D 0.304
D 17 10 5 9 E 1.769
E 21 11 2 10 F 0.347
F 17 10 6 8 G 0.978
G 21 11 8 10 H 1.778
H 20 12 2 14 J 1.436
J 25 14 7 12 x1 0.978
x2 3.675
予測データ Q1 Q2 Q3 Q4 x3 1.463
x1 21 11 8 10
x2 20 12 7 14   平均値 標準偏差
x3 25 14 6 12 Q1 18.111 3.755
ここで、Qは変数(属性です。) Q2 10.889 1.37
Q3 4.667 2
Q4 8.778 3.154
処理のポイントは、マハラノビス距離を求めることです。
まず、基準データ行列AAを読込み、その相関係数行列RRを求めます。
次にAA行列の標準化を行います。
次に示す関係式を用いてマハラノビス距離を計算します。
・マハラノビス距離=AA行列*RRの逆行列*AAの転置行列/変数の個数
データ行列 標準化した基準データAA
基準データ Q1 Q2 Q3 Q4   Q1 Q2 Q3 Q4
A 13 11 5 3 A -1.361 0.0811 0.1667 -1.832
B 13 9 3 5 B -1.361 -1.379 -0.833 -1.198
C 16 10 4 8 C -0.562 -0.649 -0.333 -0.247
D 17 10 5 9 D -0.296 -0.649 0.1667 0.0704
E 21 11 2 10 E 0.7694 0.0811 -1.333 0.3875
F 17 10 6 8 F -0.296 -0.649 0.6667 -0.247
G 21 11 8 10 G 0.7694 0.0811 1.6667 0.3875
H 20 12 2 14 H 0.5031 0.8111 -1.333 1.6555
J 25 14 7 12 J 1.8347 2.2711 1.1667 1.0215
標準偏差 3.7548 1.3699 2 3.1545
平均値 18.111 10.889 4.6667 8.7778
相関RR Q1 Q2 Q3 Q4 AA行列*逆行列の結果=BB
Q1 1 0.8017 0.2861 0.8464 1行目 -2.256 2.9599 -0.039 -1.733
Q2 0.8017 1 0.2704 0.6114 2行目 0.5499 -0.926 -0.773 -1.119
Q3 0.2861 0.2704 1 -0.029 3行目 -0.89 -0.418 0.0566 0.7636
Q4 0.8464 0.6114 -0.029 1 4行目 -1.217 -0.928 0.8155 1.6921
5行目 6.5824 -1.942 -2.811 -4.079
相関行列の逆行列 6行目 -0.391 -1.128 1.1071 0.8063
8.5269 -3.054 -1.772 -5.402 7行目 1.2666 -1.632 1.7564 0.365
-3.054 2.9355 0.1032 0.7931 8行目 -4.767 2.02 -0.385 4.4441
-1.772 0.1032 1.5224 1.4813 9行目 1.123 1.9942 0.2728 -1.14
-5.402 0.7931 1.4813 5.1303
BB行列の1行目*AAの置換行列の乗算を行い、結果を4で割ると(変数の個数が4個)、
次に示すマハラノビスの距離が得られます。
A B C D E F G H J
1.62 0.628 0.141 0.304 1.769 0.347 0.978 1.778 1.436
上の表で、最大値はH項目の1.778です。
従って、このH項目の「1.778」が、外れ値の基準閾値となります。
次に、予測データについても同様な計算を行います。結果は次のとおりです。
x1 x2 x3
0.978 3.675 1.463
この表のX2項目のマハラノビス距離は基準閾値より大きいので、外れ値と判断します。
操作画面は次のとおりです。
トップへ

Download
デモ

ダウンロード前に必ずお読みください!

  • ダウンロードは、「Downloadデモ」をクリックして下さい。ダウンロード後、HDD内の任意の場所で解凍してご利用下さい。
    Windows LZH形式の圧縮ファイルです。LZH形式対応のファイル圧縮解凍ソフトが別途必要です。 「+Lhaca 」などフリーウェアもインターネット上で配布されておりますので、ご利用下さい。
  • ご使用にあたり、Windows(R)版 Microsoft(R) Excel(R)97以降(Excel2000以降推奨)のバージョンで、 Excelが通常動作できる程度のRAMとHDD容量が必要です。 また、分析ツールが稼動することが必要です。「分析ツール-VBA」をアドインさせて下さい。
  • 本ソフトウエアの営利目的の譲渡を禁じます。 本ソフトウエアに対する解析、リバースエンジニアリング、逆アセンブル、修正等は一切禁止します。
  • 本ソフトウエアの導入によって生じた損害等につきましては、著作権者は一切の責任を負い兼ねます。 また、本ツールのご使用に基づく解析経過や結果におきましては、ご自身のリスクと判断でご活用下さい。 解析結果及び直接の損害・不便のほか、第三者の不便等一切の責任を負いかねます。予めご了承下さい。
  • ファイルのアップロードの時点で、出来る限りのウィルス対策を施しておりますが、 アップロード後に発見されたウィルス等により、検知できない場合がございます。 ご使用前には、ご自身の責任と費用負担において、必ずウィルスチェックを行ってください。

  • 以上の項目に同意いただける場合は、ダウンロードを実行してください。同意いただけない場合、ダウンロードはご遠慮ください。