Basisdaten einer Fehlersimulation mit Parametern eines Quaders zur explorativen Untersuchung des Verhaltens der Eigenwerte und Faktoren in Abhängigkeit vom variierten Fehlerbereich 1%-50%
Überblicks-
und Verteilerseite zu diesen Versuchen
Fortlaufende
und vorläufige Hauptergebnisse des Eigenwertverhaltens bei den F%*30
Fehlersimulationsversuchen vom Typ Quader.
von Rudolf Sponsel, Erlangen
Versuchsplan
Es soll untersucht werden, wie sich die Eigenwerte und Faktoren einer
Versuchsreihe über 100 Quader (N=100) bei drei unabhängigen und
5 abhängigen Parametern verändern (V=Variable=8), wenn für
jeden einzelnen Wert von einander unabhängige Fehlerberechnungen erfolgen.
Die Fehlerraten werden schrittweise von 1% bis 50% erhöht, so daß
sich insgesamt 51 Haupt-Versuche (Ausgangsversuch=F00%, F01%, F02%, ...,
F50%) ergeben. Für jede einzelne Fehlerrate F01%, F02%, ..., F50%
werden n=30 Stichproben aus den Fehlerraten-Universa U01%, U02%, ..., U50%
gezogen. Hierbei gelangt der von Jörn Wilms für die Statlib in
Omikron.Basic programmierte normalverteilte Zufallsgenerator zur Anwendung.
Dies führt insgesamt neben der "Wahren Wert" Basisdatenbestimmung
zu 50*30=1500 Fehleruntersuchungen und damit zu 1500 Matrix-, Eigenwert-
und Faktorenanalysen mit einer Darstellung und Analyse der Ergebnisse,
Schlußfolgerungen und Ausblick:
Wahrer-Wert-Basisversuch ........... q00
30x50 Einzelversuche ............... q01 (1,2,...,30), q02(1,2,...,30),
..., ...,
qi(1,2,...30), ...,... q50(1,2,...,30)
Darstellung u. Analyse der Ergebnisse q51
Schlußfolgerungen und Ausblick ..... q52
Um bestmögliche Anschauung und Kontrolle zu erhalten, wird von Quadern ausgegangen, weil hier aufgrund der Dreidimensionalität die Anschauung unterstützt wird und die abhängigen Größen gut nachvollziehbar sind. Insgesamt enthält diese Untersuchung 51*30*100 = 153.000 Quader-'ProbandInnen' - denen ich für ihre einfache, willige, ja selbstlose Teilnahme recht herzlich danke ;-))) - mit insgesamt 1.224.000 Testwerten.
Die drei unabhängigen Parameter des Quaders bezeichnen wir mit L=Länge, B=Breite und H=Höhe. Die Werte für L, B und H werden ausgehend von L = 1,2, ..., 100 für B und H zufällig erzeugt.
Fehlermodell
Um die einzelnen fehlerbehafteten Werte für die 50 Versuche (F01%,
F02%, ..., F50%) zu berechnen, braucht man ein Fehlermodell, d.h. eine
Reihe von Annahmen und Hilfswerten. Die Parameter des hier angewendeten
Fehlermodells sind:
Bildung der
Basisdaten
Beschreibung der Basisrohdatenerzeugung: In Excel wurden die Zahlen
1-100 in der ersten Spalte vorgegeben, die Länge eignet sich also
auch zur Bezeichnung der jeweiligen Zeile bei den Basisdaten.
Spalte B und C wurde mit der Funktion 'Zufallsbereich' mit unterer
Grenze 1 und oberer Grenze 100 erzeugt.
Das Volumen ergibt sich mit Länge * Breite * Höhe, für
L=1: 1*94*62=5828.
Die Oberfläche wurde gebildet mit L*B*2 + L*H*2+B*H*2, für
L=1: 1*94*2 + 1*62*2 + 94*62*2 = 11968.
L*B für L=1: 1 * 94 = 94
L*H für L=1: 1 * 62 = 62
B*H für L=1: 94 * 32 = 5828
Urdatenliste:
1
2 3
4 5
6 7
8
i\j: Länge Breite Höhe
Volum Oberfl L*B L*H
B*H
1 1
94 62 5828
11968 94 62
5828
2 2
65 71 9230
9774 130 142
4615
3 3
19 39 2223
1830 57 117
741
4 4
70 92 25760
14176 280 368
6440
5 5
85 8
3400 2290 425
40 680
6 6
97 73 42486
16202 582 438
7081
7 7
46 45 14490
5414 322 315
2070
8 8
19 75 11400
4354 152 600
1425
9 9
13 86 10062
4018 117 774
1118
10 10 58
39 22620 6464
580 390 2262
11 11 13
71 10153 3694
143 781 923
12 12 1
59 708 1558
12 708 59
13 13 41
73 38909 8950
533 949 2993
14 14 32
20 8960 2736
448 280 640
15 15 82
34 41820 9056
1230 510 2788
16 16 19
29 8816 2638
304 464 551
17 17 97
57 93993 16294 1649
969 5529
18 18 72
53 68688 12132 1296
954 3816
19 19 87
43 71079 12422 1653
817 3741
20 20 79
38 60040 10684 1580
760 3002
21 21 54
49 55566 9618
1134 1029 2646
22 22 82
19 34276 7560
1804 418 1558
23 23 40
55 50600 8770
920 1265 2200
24 24 74
73 129648 17860 1776
1752 5402
25 25 79
50 98750 14350 1975
1250 3950
26 26 80
40 83200 12640 2080
1040 3200
27 27 46
2 2484 2776
1242 54 92
28 28 53
42 62328 9772
1484 1176 2226
29 29 32
52 48256 8200
928 1508 1664
30 30 36
80 86400 12720 1080
2400 2880
31 31 78
79 191022 22058 2418
2449 6162
32 32 64
68 139264 17152 2048
2176 4352
33 33 44
12 17424 4752
1452 396 528
34 34 60
67 136680 16676 2040
2278 4020
35 35 6
91 19110 7882
210 3185 546
36 36 58
26 54288 9064
2088 936 1508
37 37 92
27 91908 13774 3404
999 2484
38 38 16
25 15200 3916
608 950 400
39 39 72
9 25272 7614
2808 351 648
40 40 67
48 128640 15632 2680
1920 3216
41 41 52
31 66092 10030 2132
1271 1612
42 42 34
46 65688 9848
1428 1932 1564
43 43 15
6 3870 1986
645 258 90
44 44 76
14 46816 10048 3344
616 1064
45 45 95
100 427500 36550 4275
4500 9500
46 46 98
75 338100 30616 4508
3450 7350
47 47 75
40 141000 16810 3525
1880 3000
48 48 25
21 25200 5466
1200 1008 525
49 49 47
38 87514 11902 2303
1862 1786
50 50 91
12 54600 12484 4550
600 1092
51 51 84
85 364140 31518 4284
4335 7140
52 52 49
54 137592 16004 2548
2808 2646
53 53 92
20 97520 15552 4876
1060 1840
54 54 43
8 18576 6196
2322 432 344
55 55 96
68 359040 31096 5280
3740 6528
56 56 87
64 311808 28048 4872
3584 5568
57 57 64
67 244416 23510 3648
3819 4288
58 58 98
84 477456 37576 5684
4872 8232
59 59 90
25 132750 18070 5310
1475 2250
60 60 9
12 6480 2736
540 720 108
61 61 36
64 140544 16808 2196
3904 2304
62 62 55
26 88660 12904 3410
1612 1430
63 63 83
22 115038 16882 5229
1386 1826
64 64 60
89 341760 29752 3840
5696 5340
65 65 54
23 80730 12494 3510
1495 1242
66 66 36
38 90288 12504 2376
2508 1368
67 67 13
20 17420 4942
871 1340 260
68 68 78
69 365976 30756 5304
4692 5382
69 69 80
84 463680 36072 5520
5796 6720
70 70 46
45 144900 16880 3220
3150 2070
71 71 38
82 221236 23272 2698
5822 3116
72 72 4
69 19872 11064 288
4968 276
73 73 52
38 144248 17092 3796
2774 1976
74 74 61
67 302438 27118 4514
4958 4087
75 75 82
96 590400 42444 6150
7200 7872
76 76 7
95 50540 16834 532
7220 665
77 77 79
46 279818 26518 6083
3542 3634
78 78 12
21 19656 5652
936 1638 252
79 79 40
100 316000 30120 3160
7900 4000
80 80 51
100 408000 34360 4080
8000 5100
81 81 4
23 7452 4558
324 1863 92
82 82 56
52 238784 23536 4592
4264 2912
83 83 79
98 642586 44866 6557
8134 7742
84 84 75
60 378000 31680 6300
5040 4500
85 85 3
17 4335 3502
255 1445 51
86 86 72
32 198144 22496 6192
2752 2304
87 87 96
41 342432 31710 8352
3567 3936
88 88 31
77 210056 23782 2728
6776 2387
89 89 65
13 75205 15574 5785
1157 845
90 90 42
93 351540 32112 3780
8370 3906
91 91 54
69 339066 29838 4914
6279 3726
92 92 9
2 1656 2060
828 184 18
93 93 53
99 487971 38766 4929
9207 5247
94 94 24
23 51888 9940
2256 2162 552
95 95 47
25 111625 16030 4465
2375 1175
96 96 1
59 5664 11638
96 5664 59
97 97 97
85 799765 51798 9409
8245 8245
98 98 92
65 586040 42732 9016
6370 5980
99 99 27
72 192456 23490 2673
7128 1944
100 100 47
84 394800 34096 4700
8400 3948
Mittelwert Varianz
Standard AW
1 50.5
833.25 28.87
2 54.83
812.88 28.51
3 51.34
760.1 27.57
4 150478.08
2.8422782E+10 168590.57
5 16541.58
1.3226674E+8 11500.73
6 2689.04
4678583.9 2163
7 2671.75
6003256.1 2450.15
8 2910
5355141.4 2314.12
[Intern: Programm KOR_D.BAS doppelte Genauigkeit ohne
Missing Data. Daten von C:\OMI\NUMERIK\MATRIX\URDAT\BASIS\BASIS100.V08
Dateiname = C:\OMI\NUMERIK\MATRIX\URDAT\BASIS\BASIS100.DAN.
Korrelation in C:\OMI\NUMERIK\MATRIX\KK\BASIS100.D08
Auswertung vom 10/23/02 22:03:16]
Standard-Matrixanalyse
der Korrelationsmatrix der Basisdaten
Abstract/ Zusammenfassung Analsye Korrelationsmatrix
der Basisdaten
Man wird bei der Konstruktion des Beispiels drei unabhängige Faktoren erwarten, aus denen sich die ursprüngliche Korrelationsmatrix gut reproduzieren lassen sollte. Die ersten drei Eigenwerte schöpfen 96,4% der Spur aus. Das ist bereits eine wichtige Information über die Größenordnung, die man braucht für Variablenreduktion. |
Samp _Ord_
MD_
NumS_
Condition_
Determinant_
HaInRatio_
R_OutIn_
K_Norm_
C_Norm
100 8 0 -
2.3D+18 0
3.22D-54 3095 0(2)
0(1)
|
********** Summary
of standard correlation matrix analysis ***********
File = BASIS100.D08 N-order= 8 N-sample= 100
Rank= 8 Missing data = 0
Positiv Definit=Cholesky successful________= Yes with 0 negat.
eigenvalue/s
HEVA: Highest eigenvalue abs.value_________=
5.0484402157651329
LEVA: Lowest eigenvalue absolute value_____=
2.1684043449710089D-18
CON: Condition number HEVA/LEVA___________~=
2.3281821157910609D+18
DET: Determinant original matrix (OMIKRON)_=
2.0025326623544479D-22
DET: Determinant (CHOLESKY-Diagonal^2)_____=
2.0084413255412398D-22
DET: Determinant (PESO-CHOLESKY)___________=
2.0084413255412398D-22
DET: Determinant (product eigenvalues)_____=
7.6097298434688638D-23
DET: Determ.abs.val.(PESO prod.red.norms)__=
2.0047530783952236D-22
HAC: HADAMARD condition number_____________=
1.3010709565510105D-24
HCN: Heuristic condition |DET|CON__________=
8.6012715619286294D-41
D_I: Determinant Inverse absolute value____=
4.9936763519465641D+21
HDA: HADAMARD Inequality absolute value___<=
1.5460462323984913D+75
HIR: HADAMARD RATIO: D_I / HDA ____________=
3.2299657327837599D-54
Highest inverse positive diagonal value____=
1.1802007244091579D+17
thus multiple r( 5.rest)_________________=
1
and 5 multiple r > .99
There are no negative inverse diagonal values.
Maximum range (upp-low) multip-r( 1.rest)_=
.059
LES: Numerical stability analysis:
Ratio maximum range output / input _______=
3094.9693464327093
PESO-Analysis correlation least Ratio RN/ON=
0 (<-> Angle = 0 )
Number of Ratios correlation RN/ON < .01__ =
2
PESO-Analysis Cholesky least Ratio RN/ON__ =
0 (<-> Angle = 0 )
Number of Ratios Cholesky RN/ON < .1 _____ =
1
Ncor
L1-Norm L2-Norm Max Min
m|c| M|c| N_comp s-S S-S
64 39.1 5.4
1 -.097 .555 .263
378 .298 .234
class boundaries and distribution of the correlation coefficients
-1 -.8 -.6 -.4 -.2 0
.2 .4 .6 .8 1
0 0 0
0 2 8 2
16 16 20
Korrelationsmatrix
Original data with 17, input read with 17, computet
with 19, and showed with 3 digit accuracy (for control here the analysed
original matrix):
Läng Breit Höhe Volum Ober
L*B L*H B*H
1 -.097 .099 .546 .562
.627 .715 .053 Länge
-.097 1 .121 .474 .537
.608 .057 .705 Breite
.099 .121 1 .6
.656 .208 .696 .698 Höhe
.546 .474 .600 1
.971 .835 .814 .770 Volumen
.562 .537 .656 .971 1
.841 .839 .811 Oberfläche
.627 .608 .208 .835 .841 1
.580 .540 Länge*Breite
.715 .057 .696 .814 .839 .580
1 .483 Länge*Höhe
.053 .705 .698 .77 .811
.540 .483 1 Breite*Höhe
i.Eigenvalue
Cholesky i.Eigenvalue Cholesky i.Eigenvalue
Cholesky
1. 5.04844 1
2. 1.52607 .9953
3. 1.13646 .9864
4. .1156 .4341
5. .10045 .0656
6. .06789 .2932
7. 5.08D-3 .2385
8. 0 0
Cholesky decomposition successful, thus the matrix is (semi)
positive definit.
Eigenvalues in per cent of trace = 8
1 .6311 2 .1908 3 .1421
4 .0145 5 .0126 6 8.5D-3
7 6D-4 8 0
[Intern: File = C:\OMI\NUMERIK\MATRIX\SMA\BASIS100\BASIS100.SMA
with data from C:\OMI\NUMERIK\MATRIX\SMA\BASIS100\BASIS100.D08
Date: 10/23/02 Time:22:04:06]
Summary/Abstract/Zusammenfassung der Rückrechnung
Die Matrix ist positiv definit, somit ist die Durchführung einer Hauptkomponentenanalyse und der Berechnung der Faktoren kein Problem. Die Reduktion auf drei Faktoren ist nach dem Quadermodell mit den drei unabhängigen Parametern Länge, Breite und Höhe klar und wird durch die Rückrechnung konstruktionsbedingt erwartungsgemäß auch bestätigt. Unterschiede zwischen Original- und Reproduktionsmatrix hier. |
Faktormatrix F:
.562 -.738 -.312
.532 .723 -.397
.663 .067 .727
.972 -.029 -.028
1 3D-3 -8D-3
.838 -.03 -.505
.84 -.445 .242
.811 .506 .197
Transpose Factor Matrix F' :
.562 .532 .663 .972 1
.838 .84 .811
-.738 .723 .067 -.029 3D-3 -.03 -.445
.506
-.312 -.397 .727 -.028 -8D-3 -.505 .242 .197
Reproduction Matrix F * F' with DET= 2.6962527707020301D-95
.957 -.111 .096 .577 .562
.65 .725 .022
-.111 .962 .112 .507 .536
.624 .029 .719
.096 .112 .973 .622 .657
.186 .703 .715
.577 .507 .622 .947 .972
.83 .823 .769
.562 .536 .657 .972 .999
.841 .837 .811
.65 .624 .186 .83 .841
.958
.595 .565
.725 .029 .703 .823 .837 .595
.962
.504
.022 .719 .715 .769 .811 .565
.504 .953
[Intern: Analysis from 10/24/02 11:55:20
with KORFAK1.BAS (08/31/94)
3 Factors data from file C:\OMI\NUMERIK\MATRIX\SMA\BASIS100\FAK\BASIS100.F3
Reproduction matrix in C:\OMI\NUMERIK\MATRIX\FAK\NEU\BASIS100IMA
Reproduction correlations in C:\OMI\NUMERIK\MATRIX\FAK\NEU\BASIS1D.F08
Einlesen im MAT-Format 11,12,13,...N*M-Wwerte
eingelesen 8 urspruengl. Zahl Variable reproduziert
durch 3 Faktoren]
Residual
analyse der Original-Korrelation- mit aus 3-Faktoren rückgerechneten
Koeffizienten
Summary/Abstract/Zusammenfassung Residual-Analyse:
Mean= .01587853 Sigma= .01366647 Maximum range= .05301334 (r4.4) Obwohl hier ein Wahres-Wert-Modell gerechnet wurde, ist die maximale Abweichung zwischen Original- und Reproduktionsmatrix immerhin schon 0,05301334. |
Matrix residuals (whole matrix inclusive diagonal):
Mean absolute values of residuals = .015878532285031588
Sigma absolute values of residuals = .013666471154259211
Maximum range absolute values = .05301334025837104
(r4.4)
Matrix residuals upper triangular matrix without diagonal:
Mean absolute values of residuals = .012985651776874178
Sigma absolute values of residuals = .01067233
Maximum range absolute values = .03300600076789634
(r2.4)
Original Korrelations
Matrix A:
1 -.097 .099 .546 .562
.627 .715 .053
-.097 1 .121 .474 .537
.608 .057 .705
.099 .121 1 .6
.656 .208 .696 .698
.546 .474 .6 1
.971 .835 .814 .77
.562 .537 .656 .971 1
.841 .839 .811
.627 .608 .208 .835 .841 1
.58 .54
.715 .057 .696 .814 .839 .58
1 .483
.053 .705 .698 .77 .811
.54 .483 1
Aus
drei Faktoren rückgerechnete Reproduktions Matrix B:
.957 -.111 .096 .577 .562 .65
.725 .022
-.111 .962 .112 .507 .536
.624 .029 .719
.096 .112 .973 .622 .657
.186 .703 .715
.577 .507 .622 .947 .972
.83 .823 .769
.562 .536 .657 .972 .999
.841 .837 .811
.65 .624 .186 .83 .841
.958
.595 .565
.725 .029 .703 .823 .837 .595
.962
.504
.022 .719 .715 .769 .811 .565
.504 .953
Matrix of residuals:
.043 .014 3E-3 -.03 -1E-3 -.024
-.01 .031
.014 .038 8E-3 -.033 0
-.016 .028 -.014
3E-3 8E-3 .027 -.022 -1E-3 .022
-7E-3 -.017
-.03 -.033 -.022 .053 -1E-3 6E-3 -9E-3
1E-3
-1E-3 0 -1E-3 -1E-3 1E-3 -1E-3
2E-3 0
-.024 -.016 .022 6E-3 -1E-3 .042 -.015
-.025
-.01 .028 -7E-3 -9E-3 2E-3 -.015 .038
-.021
.031 -.014 -.017 1E-3 0 -.025
-.021 .047
[Intern: Matrix A from C:\OMI\NUMERIK\MATRIX\SMA\BASIS100\BASIS100.D08
Matrix B from C:\OMI\NUMERIK\MATRIX\SMA\BASIS100\FAK\F3\BASISF3.F08
Matrix RES(iduals) in C:\OMI\NUMERIK\MATRIX\SMA\BASIS100\FAK\F3\BASIS3f.RES
Analysis from 10/24/02 12:03:16]
Sponsel,
Rudolf & Hain, Bernhard (1994). Numerisch instabile Matrizen und Kollinearität
in der Psychologie. Diagnose, Relevanz & Utilität, Frequenz, Ätiologie,
Therapie. Ill-Conditioned Matrices and Collinearity in Psychology.
Deutsch-Englisch. Übersetzt von Agnes Mehl. Kapitel 6 von Dr. Bernhard
Hain: Bemerkungen über Korrelationsmatrizen. Erlangen: IEC-Verlag
[ISSN-0944-5072 ISBN 3-923389-03-5]
Aktueller Preis: http://ww.iec-verlag.de
___
Sponsel, Rudolf (2005). Fast-
Kollinearität in Korrelationsmatrizen mit Eigenwert-Analysen erkennen.
Ergänzungsband - Band II zu "Numerisch instabile Matrizen und
Kollinearität in der Psychologie - Ill-Conditioned Matrices
and Collinearity in Psychology - Diagnose, Relevanz & Utilität,
Frequenz, Ätiologie, Therapie". Erlangen: IEC-Verlag. ISSN-0944-5072
* ISBN 3-923389-13-2. WIRE-O-Ringbindung DIN A4.
___
Cooley,
W.W. & Lohnes, P.R. (1971). Multivariate Data Analysis. New York: Wiley.
p. 111: F = VEK * SQR(EIG)
___
Man kann die
numerische Stabilität einer Korrelationsmatrix erhöhen, wenn
man die Diagonalelemente numerisch größer macht. Diese Methode
stammt von TIKHONOV, heißt auch Regularisierungs- oder
auch Ridge-Methode. Siehe Sponsel (1994, Kap. 5, S. 08-10) mit Beispielen
___
Suchen in der IP-GIPT,
z.B. mit Hilfe von "google": <suchbegriff>
site:www.sgipt.org
z.B. Eigenwerte site:www.sgipt.org. * Faktorenanalyse Quaderversuch site:www.sgipt.org. |