Teilweise gekürzte Basisdaten q00b einer Fehlersimulation mit Parametern eines Quaders zur explorativen Untersuchung des Verhaltens der Eigenwerte und Faktoren in Abhängigkeit vom variierten Fehlerbereich 1%-50%
von Rudolf Sponsel, Erlangen
Überblicks- und Verteilerseite
zu diesen Versuchen
Versuchsbeschreibung * Urdatenliste gekürzte "Wahre Werte"*Standard-Matrixanalyse * Korrelationsmatrix * Faktorenanalyse * Querverweise * Originalversuch q00
Versuchsbeschreibung: In der Diskussion um diesen Versuch wurde eingewandt, daß die Ergebnisse der Korrelationsmatrix, Eigenwert- und Faktorenanalyse dadurch verzerrend beeinflußt würden, weil sehr kleine Rohwertdaten sehr großen gegenüberstünden. Tatsächlich spielt dies theoretisch und nach der Mathematik keine Rolle, weil die Korrelationsmatrix invariant gegen lineare Transformationen der Rohdaten ist: man kann also jeden Rohdatenvektor einer beliebigen Transformation vom Typ y = ax+b unterziehen, ohne daß sich die Korrelationen, Eigenwert- oder Faktorenstruktur nennenswert ändert bis auf geringfügige Veränderungen im Nachkommabereich (hier Eigenwertveränderungen ab der 10. Nachkommastelle und Anzeige eines negativen Eigenwertes im Rechnergenauigkeitsgrenzbereich). Dies sei im folgenden für eine Variante der Basisdaten "Wahre Werte" dargelegt.
Urdatenliste:
1
2 3
4 5
6 7
8
i\j: Länge Breite Höhe
Volum Oberfl L*B L*H
B*H
1 1
94 62 5.83
11.97 9.4 6.2
58.28
2 2
65 71 9.23
9.77 13 14.2
46.15
3 3
19 39 2.22
1.83 5.7 11.7
7.41
4 4
70 92 25.76
14.18 28 36.8
64.4
5 5
85 8
3.4 2.29 42.5
4 6.8
6 6
97 73 42.49
16.2 58.2 43.8 70.81
7 7
46 45 14.49
5.41 32.2 31.5 20.7
8 8
19 75 11.4
4.35 15.2 60
14.25
9 9
13 86 10.06
4.02 11.7 77.4 11.18
10 10 58
39 22.62 6.46
58 39 22.62
11 11 13
71 10.15 3.69
14.3 78.1 9.23
12 12 1
59 .71 1.56
1.2 70.8 .59
13 13 41
73 38.91 8.95
53.3 94.9 29.93
14 14 32
20 8.96 2.74
44.8 28 6.4
15 15 82
34 41.82 9.06
123 51 27.88
16 16 19
29 8.82 2.64
30.4 46.4 5.51
17 17 97
57 93.99 16.29 164.9
96.9 55.29
18 18 72
53 68.69 12.13 129.6
95.4 38.16
19 19 87
43 71.08 12.42 165.3
81.7 37.41
20 20 79
38 60.04 10.68 158
76 30.02
21 21 54
49 55.57 9.62
113.4 102.9 26.46
22 22 82
19 34.28 7.56
180.4 41.8 15.58
23 23 40
55 50.6 8.77
92 126.5 22
24 24 74
73 129.65 17.86 177.6
175.2 54.02
25 25 79
50 98.75 14.35 197.5
125 39.5
26 26 80
40 83.2 12.64
208 104 32
27 27 46
2 2.48 2.78
124.2 5.4 .92
28 28 53
42 62.33 9.77
148.4 117.6 22.26
29 29 32
52 48.26 8.2
92.8 150.8 16.64
30 30 36
80 86.4 12.72
108 240 28.8
31 31 78
79 191.02 22.06 241.8
244.9 61.62
32 32 64
68 139.26 17.15 204.8
217.6 43.52
33 33 44
12 17.42 4.75
145.2 39.6 5.28
34 34 60
67 136.68 16.68 204
227.8 40.2
35 35 6
91 19.11 7.88
21 318.5 5.46
36 36 58
26 54.29 9.06
208.8 93.6 15.08
37 37 92
27 91.91 13.77 340.4
99.9 24.84
38 38 16
25 15.2 3.92
60.8 95 4
39 39 72
9 25.27 7.61
280.8 35.1 6.48
40 40 67
48 128.64 15.63 268
192 32.16
41 41 52
31 66.09 10.03 213.2
127.1 16.12
42 42 34
46 65.69 9.85
142.8 193.2 15.64
43 43 15
6 3.87 1.99
64.5 25.8 .9
44 44 76
14 46.82 10.05 334.4
61.6 10.64
45 45 95
100 427.5 36.55 427.5
450 95
46 46 98
75 338.1 30.62 450.8
345 73.5
47 47 75
40 141 16.81
352.5 188 30
48 48 25
21 25.2 5.47
120 100.8 5.25
49 49 47
38 87.51 11.9
230.3 186.2 17.86
50 50 91
12 54.6 12.48
455 60 10.92
51 51 84
85 364.14 31.52 428.4
433.5 71.4
52 52 49
54 137.59 16
254.8 280.8 26.46
53 53 92
20 97.52 15.55 487.6
106 18.4
54 54 43
8 18.58 6.2
232.2 43.2 3.44
55 55 96
68 359.04 31.1 528
374 65.28
56 56 87
64 311.81 28.05 487.2
358.4 55.68
57 57 64
67 244.42 23.51 364.8
381.9 42.88
58 58 98
84 477.46 37.58 568.4
487.2 82.32
59 59 90
25 132.75 18.07 531
147.5 22.5
60 60 9
12 6.48 2.74
54 72 1.08
61 61 36
64 140.54 16.81 219.6
390.4 23.04
62 62 55
26 88.66 12.9
341 161.2 14.3
63 63 83
22 115.04 16.88 522.9
138.6 18.26
64 64 60
89 341.76 29.75 384
569.6 53.4
65 65 54
23 80.73 12.49 351
149.5 12.42
66 66 36
38 90.29 12.5
237.6 250.8 13.68
67 67 13
20 17.42 4.94
87.1 134 2.6
68 68 78
69 365.98 30.76 530.4
469.2 53.82
69 69 80
84 463.68 36.07 552
579.6 67.2
70 70 46
45 144.9 16.88 322
315 20.7
71 71 38
82 221.24 23.27 269.8
582.2 31.16
72 72 4
69 19.87 11.06 28.8
496.8 2.76
73 73 52
38 144.25 17.09 379.6
277.4 19.76
74 74 61
67 302.44 27.12 451.4
495.8 40.87
75 75 82
96 590.4 42.44 615
720 78.72
76 76 7
95 50.54 16.83 53.2
722 6.65
77 77 79
46 279.82 26.52 608.3
354.2 36.34
78 78 12
21 19.66 5.65
93.6 163.8 2.52
79 79 40
100 316 30.12
316 790 40
80 80 51
100 408 34.36
408 800 51
81 81 4
23 7.45 4.56
32.4 186.3 .92
82 82 56
52 238.78 23.54 459.2
426.4 29.12
83 83 79
98 642.59 44.87 655.7
813.4 77.42
84 84 75
60 378 31.68
630 504 45
85 85 3
17 4.33 3.5
25.5 144.5 .51
86 86 72
32 198.14 22.5 619.2
275.2 23.04
87 87 96
41 342.43 31.71 835.2
356.7 39.36
88 88 31
77 210.06 23.78 272.8
677.6 23.87
89 89 65
13 75.2 15.57
578.5 115.7 8.45
90 90 42
93 351.54 32.11 378
837 39.06
91 91 54
69 339.07 29.84 491.4
627.9 37.26
92 92 9
2 1.66 2.06
82.8 18.4 .18
93 93 53
99 487.97 38.77 492.9
920.7 52.47
94 94 24
23 51.89 9.94
225.6 216.2 5.52
95 95 47
25 111.63 16.03 446.5
237.5 11.75
96 96 1
59 5.66 11.64
9.6 566.4 .59
97 97 97
85 799.77 51.8 940.9
824.5 82.45
98 98 92
65 586.04 42.73 901.6
637 59.8
99 99 27
72 192.46 23.49 267.3
712.8 19.44
100 100 47
84 394.8 34.1
470 840 39.48
Mittelwert
Varianz Standard AW
1 50.5
833.25 28.87
2 54.83
812.88 28.51
3 51.34
760.1 27.57
4 150.48
28422.78 168.59
5 16.54
132.27 11.5
6 268.9
46785.84 216.3
7 267.17
60032.56 245.02
8 29.1
535.51 23.14
[Interne Quelle: Programm KOR_D.BAS doppelte Genauigkeit
ohne Missing Data. Daten von C:\OMI\NUMERIK\MATRIX\URDAT\BASIS\BASISAE1.AE1
Dateiname = C:\OMI\NUMERIK\MATRIX\URDAT\BASIS\BASISAE1.DAN.
Korrelation in C:\OMI\NUMERIK\MATRIX\KK\BASISAE1.D08. Auswertung vom 11/07/02
13:34:32]
Standard-Matrixanalyse
der Korrelationsmatrix der gekürzten Basisdaten "Wahre Werte"
Abstract/ Zusammenfassung Analyse Korrelationsmatrix
der gekürzten Basisdaten
Aufgrund der numerischen Instabilität stimmen die Matrixwerte der "gekürzten" "Wahren Werte" nicht völlig in allen Nachkommastellen mit den Originalwerten überein - was NumerikerInnen sicher nicht verwundert und Nicht-NumerikerInnen zur Verzweiflung treiben kann - aber weitestgehend. Allerdings, und das zeigt eindrucksvoll, wie labil und sensibel solche Matrizen numerisch sind, wird in der gekürzten Version ein negativer Eigenwert im Grenzbereich der Rechnergenauigkeit ausgewiesen, allerdings mit dem exakt gleichen Betrag. Dieser negative Eigenwert ist -2.1684043449710089D-18,also an der 18. Nachkommastelle. Der Gesamtvergleich der Eigenwerte: Eigenwerte Original "Wahre Werte"
Eigenwerte gekürzte "Wahre Werte"
Wie man sieht, sind die beiden kleinsten Eigenwerte zwar
betragsmäßig gleich, haben aber unterschiedliches Vorzeichen,
was ich darauf zurückführe, daß hier der Grenzbereich der
Rechnergenauigkeit berührt wird.
|
Samp _Ord_
MD_
NumS_
Condition_
Determinant_
HaInRatio_
R_OutIn_
K_Norm_
C_Norm
100 8 0 --1
2.3D+18 0
6.42D-76 3095 0(2)
0(1)
|
********** Summary
of standard correlation matrix analysis ***********
File = BASISAE1.D08 N-order= 8 N-sample= 100
Rank= 8 Missing data = 0
Positiv Definit=Cholesky successful________= Yes with 1 negat.
eigenvalue/s
HEVA: Highest eigenvalue abs.value_________=
5.0484402158325177
LEVA: Lowest eigenvalue absolute value_____=
2.1684043449710089D-18 (negativ)
CON: Condition number HEVA/LEVA___________~=
2.3281821158221367D+18
DET: Determinant original matrix (OMIKRON)_=
8.2146463840484308D-23
DET: Determinant (CHOLESKY-Diagonal^2)_____=
8.1666629190663719D-23
DET: Determinant (PESO-CHOLESKY)___________=
8.1666629190663719D-23
DET: Determinant (product eigenvalues)_____= -7.6097298409955105D-23
DET: Determ.abs.val.(PESO prod.red.norms)__=
8.2057666026646453D-23
HAC: HADAMARD condition number_____________=
5.3371603014677972D-25
HCN: Heuristic condition |DET|CON__________= 3.5283521543363643D-41
D_I: Determinant Inverse absolute value____=
1.2173378539359222D+22
HDA: HADAMARD Inequality absolute value___<=
1.8944019548821121D+97
HIR: HADAMARD RATIO: D_I / HDA ____________=
6.4259744390502209D-76
Highest inverse positive diagonal value____=
2.8763667252407028D+17
thus multiple r( 5.rest)_________________=
1
and 5 multiple r > .99
There are no negative inverse diagonal values.
Maximum range (upp-low) multip-r(1.rest)_=
.059
LES: Numerical stability analysis:
Ratio maximum range output / input _______=
3094.9693464327093
PESO-Analysis correlation least Ratio RN/ON=
0 (<-> Angle = 0 )
Number of Ratios correlation RN/ON < .01__ =
2
PESO-Analysis Cholesky least Ratio RN/ON__ =
0 (<-> Angle = 0 )
Number of Ratios Cholesky RN/ON < .1 _____ =
1
Ncor
L1-Norm L2-Norm Max Min
m|c| M|c| N_comp s-S S-S
64 39.1 5.4
1 -.097 .555 .263
378 .298 .234
class boundaries and distribution of the correlation coefficients
-1 -.8 -.6 -.4 -.2 0
.2 .4 .6 .8 1
0 0 0
0 2 8 2
16 16 20
Original data with 17, input read with 17, computet
with 19, and showed with 3 digit accuracy
(for control here the analysed original matrix):
Läng Breit Höhe Volum Ober
L*B L*H B*H
1 -.097 .099 .546 .562
.627 .715 .053
-.097 1 .121 .474 .537
.608 .057 .705
.099 .121 1 .6
.656 .208 .696 .698
.546 .474 .6 1
.971 .835 .814 .77
.562 .537 .656 .971 1
.841 .839 .811
.627 .608 .208 .835 .841 1
.58 .54
.715 .057 .696 .814 .839 .58
1 .483
.053 .705 .698 .77 .811
.54 .483 1
i.Eigenvalue Cholesky i.Eigenvalue
Cholesky i.Eigenvalue Cholesky
1. 5.04844 1
2. 1.52607 .9953
3. 1.13646 .9864
4. .1156 .4341
5. .10045 .0656
6. .06789 .2932
7. 5.08D-3 .2385
8. 0 0
Cholesky decomposition successful, thus the matrix is (semi)
positive definit.
Eigenwerte in Prozentanteilen von der Spur = 8
1 .6311 2 .1908 3 .1421
4 .0145 5 .0126 6 8.5D-3
7 6D-4 8 0
[analysed: 11/08/02 09:23:36 PRG version 30.10.2002
MABAT9q.BAS
File = C:\OMI\NUMERIK\MATRIX\SMA\BASISAE1\BASISAE1.SMA
with data from C:\OMI\NUMERIK\MATRIX\SMA\BASISAE1\BASISAE1.D08]
Matrix der 8 Faktoren nach VEK * EIW^1/2:
.562 -.738 -.312 -.177 .082 -.067 .022
0
.532 .723 -.397 -.146 -.117 .047 .024
0
.663 .067 .727 -.013 -.102 -.128 .023
0
.972 -.029 -.028 .187 .093 .089 .039
0
1 3D-3 -8D-3 -3D-3 -1D-3 8D-3
-.025 0
.838 -.03 -.505 .138 -.087 -.122 -.02
0
.84 -.445 .242 -.055 -.114 .146 -.021
0
.811 .506 .197 -.077 .201 -.021 -.023
0
Transponierte der 8 Faktoren:
.562 .532 .663 .972 1
.838 .84 .811
-.738 .723 .067 -.029 3D-3 -.03 -.445
.506
-.312 -.397 .727 -.028 -8D-3 -.505 .242 .197
-.177 -.146 -.013 .187 -3D-3 .138 -.055 -.077
.082 -.117 -.102 .093 -1D-3 -.087 -.114 .201
-.067 .047 -.128 .089 8D-3 -.122 .146 -.021
.022 .024 .023 .039 -.025 -.02 -.021
-.023
0 0 0
0 0 0
0 0
Reproduktionsmatrix aus allen 8 Faktoren:
1 -.097 .099 .546 .562
.627 .715 .053
-.097 1 .121 .474 .537
.608 .057 .705
.099 .121 1 .6
.656 .208 .696 .698
.546 .474 .6 1
.971 .835 .814 .77
.562 .537 .656 .971 1
.841 .839 .811
.627 .608 .208 .835 .841 1
.58 .54
.715 .057 .696 .814 .839 .58
1 .483
.053 .705 .698 .77 .811
.54 .483 1
Residualanalyse Original-Korrelationen und aus 8 Faktoren reproduzierte:
0 0 0
0 0 0
0 0
0 0 0
0 0 0
0 0
0 0 0
0 0 0
0 0
0 0 0
0 0 0
0 0
0 0 0
0 0 0
0 0
0 0 0
0 0 0
0 0
0 0 0
0 0 0
0 0
0 0 0
0 0 0
0 0
Mittelwert der absoluten Abweichungen .. = 8.8580588041486594D-18
Standardabweichung der abs. Abweichungen = 7.6982920584906198D-18
Maximaler absoluter Abweichungswert .... = 3.415236843329339D-17
Reproduktionsmatrix aus 3 Faktoren:
.957 -.111 .096 .577 .562 .65
.725 .022
-.111 .962 .112 .507 .536 .624
.029 .719
.096 .112 .973 .622 .657 .186
.703 .715
.577 .507 .622 .947 .972 .83
.823 .769
.562 .536 .657 .972 .999 .841
.837 .811
.65 .624 .186 .83 .841
.958 .595 .565
.725 .029 .703 .823 .837 .595
.962 .504
.022 .719 .715 .769 .811 .565
.504 .953
Residualanalyse Original-Korrelationen und aus 3 Faktoren reproduzierte:
.043 .014 3D-3 .03 1D-3
.024 .01 .031
.014 .038 8D-3 .033 0
.016 .028 .014
3D-3 8D-3 .027 .022 1D-3 .022
7D-3 .017
.03 .033 .022 .053 1D-3
6D-3 9D-3 1D-3
1D-3 0 1D-3 1D-3
1D-3 1D-3 2D-3 0
.024 .016 .022 6D-3 1D-3 .042
.015 .025
.01 .028 7D-3 9D-3 2D-3
.015 .038 .021
.031 .014 .017 1D-3 0
.025 .021 .047
Mittelwert der absoluten Abweichungen .. = .015878532284142073
Standardabweichung der abs. Abweichungen = .013666471153286723
Maximaler absoluter Abweichungswert .... = .053013340254718839
[Interne Quellen: Faktoren in C:\OMI\NUMERIK\MATRIX\SMA\BASISAE1\FAK\BASISAE1.PFA
als 1-zeiliger Spaltenvektor in C:\OMI\NUMERIK\MATRIX\SMA\BASISAE1\FAK\BASISAE1.FAK
Vektordaten von C:\OMI\NUMERIK\MATRIX\SMA\BASISAE1\BASISAE1.VEK
Negative Eigenwerte wurden 0 gesetzt:
Eigenwerte von C:\OMI\NUMERIK\MATRIX\SMA\BASISAE1\BASISAE1.EDI]
Literatur
Sponsel,
Rudolf & Hain, Bernhard (1994). Numerisch instabile Matrizen und Kollinearität
in der Psychologie. Diagnose, Relevanz & Utilität, Frequenz, Ätiologie,
Therapie. Ill-Conditioned Matrices and Collinearity in Psychology.
Deutsch-Englisch. Übersetzt von Agnes Mehl. Kapitel 6 von Dr. Bernhard
Hain: Bemerkungen über Korrelationsmatrizen. Erlangen: IEC-Verlag
[ISSN-0944-5072 ISBN 3-923389-03-5]. Aktueller Preis: http://ww.iec-verlag.de
___
Sponsel, Rudolf (2005). Fast-
Kollinearität in Korrelationsmatrizen mit Eigenwert-Analysen erkennen.
Ergänzungsband - Band II zu
"Numerisch instabile Matrizen und Kollinearität in der Psychologie
- Ill-Conditioned Matrices and Collinearity in Psychology - Diagnose,
Relevanz & Utilität, Frequenz, Ätiologie, Therapie". Erlangen:
IEC-Verlag. ISSN-0944-5072 * ISBN 3-923389-13-2. WIRE-O-Ringbindung
DIN A4.
___
Suchen in der IP-GIPT,
z.B. mit Hilfe von "google": <suchbegriff>
site:www.sgipt.org
z.B. Eigenwerte site:www.sgipt.org. |