Internet Publikation für Allgemeine und Integrative Psychotherapie
(ISSN 1430-6972)
IP-GIPT DAS=12.11.2002 Internet-Erstausgabe, letzte Änderung: 19.01.20
Impressum: Diplom-PsychologInnen Irmgard Rathsmann-Sponsel und Dr. phil. Rudolf Sponsel
Stubenlohstr. 20 D-91052 Erlangen * Mail: sekretariat@sgipt.org
Anfang_ q03_f _Datenschutz_ Überblick _ Relativ Aktuelles _ Rel. Beständiges _ Titelblatt _ Konzept _ Archiv _ Region _ Service iec-verlag _ _ Zitierung & Copyright___Wichtige Hinweise zu Links und Empfehlungen
Willkommen in der Abteilung Wissenschaftstheorie, Methodologie und Statistisch-Mathematische Methoden in der Allgemeinen und Integrativen Psychologie, Psychodiagnostik und Psychotherapie, hier:Sonderstudie: Korrelation und Eigenwertanalyse zwischen den "Wahren Werten" und Fehlern am Beispiel Versuch F03v15
Materialien und Dokumente zur Kritik der Handhabung der Faktorenanalyse.
von Rudolf Sponsel, Erlangen
Überblicks- und Verteilerseite zu diesen Versuchen
- Beschreibung dieses Versuches: Was wurde gemacht?
- Urdatenliste Abweichungen Wahrer Wert und Fehler bei F03v15
- Standard-Matrixanalyse der Korrelationsmatrix des Beispiels F03v15r16
- Die 16*16-Korrelationsmatrix Wahre Werte und Fehler
- Für die Eigenwert-Knick-Diagnostiker und Screetester eine Aufgabe: Was sagen uns diese Graphen?
Beschreibung dieses Versuches: Was wurde gemacht ?Diese Versuchsserie bringt überraschende und erstaunliche Ergebnisse, wenn etwa Eigenwerte und Reproduktionsgüte der Ursprungsmatrizen durch drei Faktoren weitgehend unabhängig von zwar zufällig normalverteilten, aber stetig zunehmenden Fehlerspannen sind. Die wirft den Verdacht auf Fehler auf, weil dieses Ergebnis dem gesunden Menschenverstand und der wissenschaftlichen Erwartung völlig widerspricht - wofür die Mathematik aber immer gut ist ;-). Ich mißtraue meinen Daten und Ergebnissen so lange, bis sie von wenigstens einer, am besten mehreren unabhängigen anderen UntersucherInnen bestätigt werden können. Schon aus diesem Grunde ist es sinnvoll, diese Versuchsergebnisse nach allen Regeln der Kunst Falsifikationsprüfungen zu unterwerfen. So wurde auch angeregt, die Korrelation zwischen den Wahren Werten mit den Fehlern, die durch den normalverteilenden Zufallsgenerator erzeugt werden, zu untersuchen, was hier nun überprüfbar geschieht.
Urdatenliste der Fehler im Versuch F03v15Hinweis: Aus Darstellungsgründen sind die Werte gerundet. Intern wurde mit 17stelliger Genauigkeit gerechnet. Die genauen Werte werden am Ende des Versuchs in einer CD-ROM im ASCII-Format angeboten.
Die folgende Liste gibt die Abweichungen der Stichprobenwerte von den "wahren Werten" wieder. Man kann dies überprüfen, indem man die Stichprobenwerte aus F03v15 von den Wahren Werten der Basisdaten abzieht. Beispiel: WW Z2,S8 = 4615. SW[F03v15] Z2,S8 = 4576.6. Und: 4615 - 4576.6 = 38.4. Die Werte stimmen nicht gänzlich überein, weil hier aus Darstellungsgründen aufgrundet nur wenige Nachkommastellen ausgegeben und tatsächlich mit 17stelliger Genauigkeit gerechnet wird.
WW = Wahre Werte SW = Fehlerbehaftete Stichproben Werte9=Fehler zu WW-1 10=Fehler zu WW-2 11=Fehler zu WW-3 12=Fehler zu WW-4
13=Fehler zu WW-5 14=Fehler zu WW-6 15=Fehler zu WW-7 16=Fehler zu WW-8Fehler zu 1 2 3 4 5 6 7 8
i\j: Länge Breite Höhe Volum Oberfl L*B L*H B*H
9 10 11 12 13 14 15 16
1 0 .3 -.2 4.1 50.04 .26 .1 21.97
2 0 -.19 .2 -12.41 54.58 -.31 .07 38.42
3 0 .15 -.04 -16.57 10.83 .25 .37 4.83
4 0 -.74 .28 166.3 -25.8 -.1 0 -9.9
5 0 .5 0 -16.1 .5 -.3 -.2 7.1
6 0 -.3 .8 -492.4 -107.7 -2.1 -2.9 -75.1
7 0 .3 -.1 78.72 50.9 -.03 -1 3.04
8 -.03 .01 -.4 60.1 3.78 1.44 4.27 -14.29
9 .07 -.07 -.06 -78.66 10.65 .52 -1.6 -1.1
10 -.02 -.17 .02 95.34 -9.95 1.69 -.25 6.83
11 .03 .14 -.17 -12.24 -27.24 -.67 5.74 3.43
12 -.06 0 .68 5.48 -7.97 .05 1.79 -.23
13 -.01 .13 -.32 -65.79 -3.19 -2.58 1.16 10.36
14 -.15 -.1 .16 -71.06 12.83 -1.86 .14 4.68
15 -.09 .28 .06 448.4 -13.7 -.2 -1.8 20.3
16 -.04 .21 .06 8.47 30.59 -1.21 .9 2.05
17 -.01 -.79 .03 368.5 114.8 -2.1 0 .6
18 0 -.3 .3 116.1 -3.7 -8.4 1.6 -30.7
19 0 -.1 .4 79.9 -33.04 -6.88 -3.99 -18.32
20 .03 .03 .25 -11.75 -1.15 17.59 2.78 -1.35
21 .07 .21 -.01 130.9 4.7 6.9 1.4 -12.8
22 -.2 .1 .1 302.8 -41.6 8.5 -.2 -3.1
23 .1 -.5 -.3 -225.5 -76.1 -1.1 -1.2 -19.5
24 0 -.2 -.3 643.5 69.84 -1.8 -.9 -22.98
25 -.04 .25 -.12 -13.13 26.13 3.89 -1.04 11.8
26 .08 .66 .18 186.3 -100.1 3.2 12.14 -2.02
27 .04 -.23 0 9.35 3.3 -5.91 -.18 -.06
28 .15 -.33 .06 -430.5 9.26 .41 -.47 6.15
29 .22 .1 .23 -116.99 65.6 -1.93 -15.4 13.03
30 -.14 -.05 -.31 442 -26.8 9.6 -14.1 9.3
31 .1 .2 -.1 -168.4 3.3 -.3 -10.2 20.76
32 -.12 .42 .33 -1357.83 59.26 -2.29 12.65 -9.14
33 -.15 .4 -.01 -61.45 63.02 .74 -2.87 4.51
34 -.18 .03 .2 879.6 75.59 -7.03 6.5 27.34
35 .11 -.03 -.03 -105.78 49.04 .63 -15.71 3.51
36 .24 .15 .06 136.7 51.05 -8.45 -3.68 6.72
37 .02 -.1 .04 155.8 -90.5 -6 -8.5 23.01
38 .16 -.11 .17 -135.47 8.61 4.91 1.79 .95
39 .02 .22 0 -92.22 -3 -22.94 -1.71 -5.3
40 -.03 .24 .08 686.8 -149.6 11.03 6.94 -6.4
41 -.16 -.53 .05 137.2 -40 -11.7 3.8 -1.5
42 -.1 -.2 .4 -133 -.6 3.1 -14.4 -12.4
43 .1 -.1 0 3.5 3.9 7.5 .3 .5
44 -.1 -.3 -.1 -79.9 -26.6 19.87 3.65 .35
45 .07 1.24 -.85 4734 -103 30.44 -6.87 -7.59
46 -.47 -.27 .14 1111 -100 -22 18.52 6.3
47 -.28 .03 -.16 -619.94 34.34 -14.47 .59 12.46
48 -.25 .09 .22 64.55 -32.86 2.29 -1.02 2.38
49 .03 .25 .17 383.4 -104.8 1.7 -7.3 -5.9
50 .1 .1 .1 -45.5 -66.1 -2.5 -1.3 1.5
51 .1 -.1 .3 2236 37.2 28.55 -38.89 -1.01
52 .1 -.23 -.21 -667.28 30.06 -2.87 1 -3.03
53 -.05 .34 .17 -21.2 96.76 -1.92 -4.99 -2.56
54 .07 -.09 0 35.93 10.08 -22.24 -.82 -.78
55 .15 .47 -.43 -98.44 195.2 -7.4 .6 5.1
56 .1 -.1 -.6 1706 214.6 -12.5 -18 36.09
57 -.02 -.08 .22 1682 -43 0 -24 8
58 1 0 0 2589 440.5 -43 -45.2 -1
59 -.2 .1 0 356.2 60.39 3.87 -.84 3.02
60 .2 -.09 -.07 6.73 17.86 .31 1.83 -.41
61 -.15 .26 .1 -380.13 -42.01 -12.47 5.89 -12.33
62 .07 .21 .13 -844.47 -45.05 14.1 17.26 7.55
63 -.01 .22 .09 1694 38.62 33.59 -1.81 -6.1
64 .12 -.21 -.48 1130 -18 31.53 -53.36 3.83
65 -.73 -.38 -.01 906 40.74 16.04 -5.3 -4.96
66 -.19 .12 -.1 478.1 68.79 9.29 16.82 2.39
67 -.17 .02 .08 121.1 -44.9 3.2 -.3 -2.4
68 .6 -.1 .2 1227 -96 -20 1 24.21
69 .04 -.18 -.02 934.9 146.7 -36.5 -9.8 -83
70 .1 -.2 -.1 -591.2 100.4 8.5 -22 -17.9
71 .4 -.1 0 -146.8 30.54 32.71 -12.98 -1.71
72 -.62 .02 .24 -87.59 11.89 -.44 -8.54 .16
73 .47 .29 .2 -607.53 22.19 -31.32 7.88 3.57
74 .49 -.13 .38 -907.19 106.4 10 7.7 28.99
75 .43 -.75 -.7 3065 333.6 -2.8 47.75 -13.12
76 -.62 0 -.15 228.4 121.5 -1.1 -26.9 -7.2
77 -.3 -.1 0 1273 -18 17.24 -6.75 1.63
78 0 -.06 -.06 2.54 -12.27 -3.5 4.64 -.6
79 .03 .3 1.2 -868.66 -16.75 -14.78 2.18 6.36
80 .28 .27 .25 1755 87.15 -28.29 -27.38 29.97
81 .81 0 -.06 19.07 32.4 2 -1.67 .28
82 -.45 -.09 .14 768.9 168.6 -7.7 3.3 6.9
83 -.7 -.3 .6 -130 135.7 -10.4 -4.9 17.09
84 .36 .22 .34 2516 43.01 36.71 -18.11 -1.22
85 -.05 .02 .02 -12.76 -13.65 1.7 -3.66 -.72
86 .34 .22 -.06 1359 211.2 -18.6 -6.3 -7.5
87 -.2 .4 -.1 -1925.9 46.78 28.5 -25.53 2.38
88 -.46 .09 .83 2187 127.3 -23.1 -24.3 -20.3
89 .1 -.4 0 -236.9 107.2 12.43 1.42 -4.65
90 -.96 -.25 .25 63.72 224.1 -.3 -49.1 33.6
91 -.39 -.13 .15 1439 -52 17.57 -36.4 -12.01
92 -.8 .04 -.01 .4 -9.52 -3.73 .17 .05
93 1.11 .51 .4 517.1 192.2 5.1 31.73 -4.24
94 .14 .08 .18 -311.25 -15.32 -28.38 13.02 -.92
95 -.33 -.21 -.06 -562.6 -70.92 -26.19 10.5 7.19
96 .67 .01 -.49 20.15 15.07 .26 -29.75 .13
97 0 .2 .66 -3918.28 -526.61 118.2 24.08 -7.38
98 .46 .42 .37 -5397.69 6.43 16.18 -20.63 30
99 .97 .05 -.11 165 -11.2 -21.7 22.6 -11.48
100 -.22 .14 .25 -2443.83 86.82 34.14 -48.29 13.2Mittelwert Varianz Standard AW
9 .01 .11 .32
10 .02 .09 .29
11 .06 .09 .3
12 174 1395900 1181
13 22 11074 105
14 1 363.2 19.1
15 -3.9 247.6 15.7
16 .6 287.2 16.9Anmerkung: Beispiel, daß die großen Unterschiede zwischen den Zahlen für die Korrelationen invariant sind hier.
[Interne Quellen: Kq_B30.BAS 10.11.2002 fuer Batchbetrieb Kor Fehler fuer Quaderversuch. Daten von C:\OMI\NUMERIK\MATRIX\URDAT\BASIS\QF03\QF03v15
Dateiname = C:\OMI\NUMERIK\MATRIX\ZUFALL\QF03v15.RAN. Fehler Kor in C:\OMI\NUMERIK\MATRIX\ZUFALL\.r16
Auswertung vom 11/10/02 23:02:08]
Standard-Matrixanalyse Korrelation Wahre Werte und Fehler im Versuch F03v15
Abstract/ Zusammenfassung Analyse Korrelationsmatrix der Basisdaten
Wir kennen den Hintergrund und die Entstehungsgeschichte dieser Matrix ganz genau. Daher haben wir natürlich kein Deutungsproblem. Betrachten wir die Gesamtmatrix, ergibt sich: Die ersten drei Eigenwerte schöpfen hier nur noch 55,58% der Spur (Varianz) aus. Nach dem 1% Kriterium (Eigenwert < 0,16) [in Worten: ein Prozent], enthält die Matrix 5 Kollinearitäten. Und wir wissen konstruktionsbedingt natürlich auch wo diese Kollinearitäten verborgen sind: im weißen Teil, dem linken oberen 8*8-Quadranten der 16*16-Korrelationsmatrix. Wir können diesem Beispiel entnehmen, daß Teilmatrizen vollständige gesetzesartige Beziehungen enthalten können (hier im weißen Teil und linken oberen Quadranten 5 Kollinearitäten). D.h. gibt es guten Grund zu der Hypothese (Eigenwerte 'nahe' 0), daß die Matrix Kollinearitäten enthält, ist es u.U. sinnvoll und nützlich, aus der Matrix so lange Zeilen und Spalten zu entnehmen, bis die Beziehungen relativ klar und eindeutig sind. Das Problem hierbei: bei größeren Matrizen landen wir sehr schnell in der kombinatorischen Explosion. Hier könnte vielleicht die Faktorenanalyse mit der Analyse der Vektoren (Ladungen) Nützliches leisten.
Methodologisch am bedeutungsvollsten könnte der Sachverhalt sein, daß Teilmatrizen ihre Eigenwert- Struktur durch Zusammenlegen mit anderen Matrizen nicht verlieren oder verändern, diese Strukturen sind nur nicht mehr so offensichtlich. Dies wirft neue Fragen zur Bedeutung der Eigenwertverlaufskurven auf: gibt es hier typische Muster mit typischen Bedeutungen? Samp _Ord_ MD_ NumS_ Condition_ Determinant_ HaInRatio_ R_OutIn_ K_Norm_ C_Norm
100 16 0 --2 1002.8 6D-8 7.94D-11 17110.5 .004(2) -1(-1)
Informationen zur Matrixanalyse: Numerische Laien hier und Professionell Interessierte hier Weitere Querverweise ********** Summary of standard correlation matrix analysis ***********
File = QF03V15.R16 N-order= 16 N-sample= 100 Rank= 16 Missing data = 0
Positiv Definit=Cholesky successful________= No with 2 negat. eigenvalue/s
HEVA: Highest eigenvalue abs.value_________= 5.2716259453905842
LEVA: Lowest eigenvalue absolute value_____= 5.2568821923921934D-3
CON: Condition number HEVA/LEVA___________~= 1002.804657296625
DET: Determinant original matrix (OMIKRON)_= 6.0232861405988299D-8
DET: Determinant (CHOLESKY-Diagonal^2)_____= -18.410804135032769
DET: Determinant (PESO-CHOLESKY)___________= -999 (not positive definit)
DET: Determinant (product eigenvalues)_____= 6.0232861405988468D-8
DET: Determ.abs.val.(PESO prod.red.norms)__= 6.02328614059883D-8
HAC: HADAMARD condition number_____________= 1.0986359573366656D-10
HCN: Heuristic condition |DET|CON__________= 6.0064401344490062D-11
D_I: Determinant Inverse absolute value____= 16602233
HDA: HADAMARD Inequality absolute value___<= 2.08845661006648D+17
HIR: HADAMARD RATIO: D_I / HDA ____________= 7.9495225954341833D-11
Highest inverse positive diagonal value____= 1.7730803
thus multiple r( 13.rest)_________________= .660310344
Highest inverse negative diagonal value____= -11.777728541
thus multiple r( 1.rest)_________________= 1.041588218 (!)
and there are 8 multiple r > 1 (!)
Maximum range (upp-low) multip-r( 11.rest)_= .11
LES: Numerical stability analysis:
Ratio maximum range output / input _______= 17110.534820664351
PESO-Analysis correlation least Ratio RN/ON= 4.099D-3 (<-> Angle = .23 )
Number of Ratios correlation RN/ON < .01__ = 2
PESO-Analysis Cholesky least Ratio RN/ON__ = (Not positiv definit)Ncor L1-Norm L2-Norm Max Min m|c| M|c| N_comp s-S S-S
256 68 6.41 1 -.466 .217 .241 7140 .237 .246class boundaries and distribution of the correlation coefficients
-1 -.8 -.6 -.4 -.2 0 .2 .4 .6 .8 1
0 0 2 14 44 122 14 14 18 28
Korrelations-Matrix: Wahre Werte und Fehler im Versuch F03v15
WW = Wahre Werte SW = Fehlerbehaftete Stichproben Werte (Simulation Messung)
1=WW_Länge 2=WW_Breite 3=WW_Höhe 4=WW_Volum
5=WW_Oberfl. 6=WW_L*B 7=WW_L*H 8=WW_B*H
9=WW 1 mit Fehler SW 1 10=WW 2 mit Fehler SW 2 Weiß = Kor WW/WW
11=WW 3 mit Fehler SW 3 12=WW 4 mit Fehler SW 4 Gelb = Kor WW/Fehler/WW
13=WW 5 mit Fehler SW 5 14=WW 6 mit Fehler SW 6 Rosa = Kor Fehler/Fehler
15=WW 7 mit Fehler SW 7 16=WW 8 mit Fehler SW 8
Ablesebeispiele Korrelationen:
Der weiße obere linke Quadrant beinhaltet die Korrelationen der Wahren Werte unter sich. Die beiden gelben Quadranten, unten links und oben rechts, enthalten die Korrelationen der Wahren Werte mit den Fehlern. Der rechte untere rosa Quadrant enthält die Korrelationen der Fehler mit den Fehlern. Der Fehlerwert der Länge (9) korreliert mit dem Fehlerwert der Breite (10) mit 0.147. Am höchsten ist die Korrelation mit -0.466 zwischen den Fehlern der Oberfläche (13) und den Fehlern bei Länge mal Breite (14). Die Wahren Werte zwischen Länge (1) und Breite (2) korrelieren mit -.098. Der Wahre Werte der Länge (1) korreliert mit mit dem Fehlerwert der Länge (9) mit 0.062. Die Korrelationen zwischen Wahren Werten und Fehlern sollten idealiter 0 sein. Das ist hier trotz N=100 nicht Fall. Evtl. empfiehlt sich ein Zufallsgeneratorversuch mit N=1000, um zu sehen, ob und wie die Korrelationen dann gegen 0 gehen. Sie sind zwar meist gering, aber nicht 0. Im großen und Ganzen sind hier die Wahren Werte als mit den Fehlern weitgehend gering bis unkorreliert anzusehen.i.Eigenvalue Cholesky i.Eigenvalue Cholesky i.Eigenvalue Cholesky
1. 5.27163 1 2. 1.9578 .9952 3. 1.66301 .9861
4. 1.3211 .4154 5. 1.19512 -.0109 6. 1.08482 -.6479
7. .9592 -1.0018 8. .81457 -1.1289 9. .65555 .9662
10. .49343 .9748 11. .36966 .9405 12. .09306 .8764
13. .08283 .8203 14. .05358 .3565 15.-5.26D-3 .6319
16.-.0101 .9462
The matrix is not positive definit. Cholesky decomposition is not success-Eigenvalues in per cent of trace = 16 (mit 100 multiplizieren)
1 .3295 2 .1224 3 .1039 4 .0826 5 .0747 6 .0678
7 .0599 8 .0509 9 .041 10 .0308 11 .0231 12 5.8D-3
13 5.2D-3 14 3.3D-3 15-3D-4 16-6D-4
Für die Eigenwert-Knick-Diagnostiker und Screetester eine Aufgabe: Was sagen uns diese Graphen ?
[Interne Quellen: analysed: 11/10/02 23:05:30 PRG version 05/24/94 MA9.BAS
File = C:\OMI\NUMERIK\MATRIX\SMA\QF03V15\QF03V15.SMA with data from C:\OMI\NUMERIK\MATRIX\SMA\QF03V15\QF03V15.R16
Date: 11/10/02 Time:23:05:30 ]
Gottfried Helms in sci.mathematik.de
Cooley, W.W. & Lohnes, P.R. (1971). Multivariate Data Analysis. New York: Wiley.
___
Sponsel, Rudolf & Hain, Bernhard (1994). Numerisch instabile Matrizen und Kollinearität in der Psychologie. Diagnose, Relevanz & Utilität, Frequenz, Ätiologie, Therapie. Ill-Conditioned Matrices and Collinearity in Psychology. Deutsch-Englisch. Übersetzt von Agnes Mehl. Kapitel 6 von Dr. Bernhard Hain: Bemerkungen über Korrelationsmatrizen. Erlangen: IEC-Verlag [ISSN-0944-5072 ISBN 3-923389-03-5]
Aktueller Preis: http://ww.iec-verlag.de
___
Man kann die numerische Stabilität einer Korrelationsmatrix erhöhen, wenn man die Diagonalelemente numerisch größer macht. Diese Methode stammt von TIKHONOV, heißt auch Regularisierungs- oder Ridge-Methode. Siehe Sponsel (1994, Kap. 5, S. 08-10) mit Beispielen.Änderungen wird fortlaufend überarbeitet, ergänzt und vertieft * Anregungen und Kritik willkommen
Querverweise
zur methodischen Umgebung dieser Untersuchung:
Standort: Versuch F03v15.
*
Überblicks- und Verteilerseite zu diesen Versuchen
Einführung und Überblick. Kritik der Handhabung der Faktorenanalyse
Was für ein Typ Matrix entsteht durch Faktorenanalysen?
Überblicks- und Verteilerseite: Numerisch instabile Matrizen und Kollinearität in der Psychologie
*
Dienstleistungs-Info.
*
Zitierung
Sponsel, Rudolf (DAS). Sonderstudie: Korrelation und Eigenwertanalyse zwischen den "Wahren Werten" und Fehlern am Beispiel Versuch F03v15. IP-GIPT. Erlangen: https://www.sgipt.org/wisms/fa/quader/q03_f.htm
Copyright & Nutzungsrechte
Diese Seite darf von jeder/m in nicht-kommerziellen Verwertungen frei aber nur original bearbeitet und nicht inhaltlich verändert und nur bei vollständiger Angabe der Zitierungs-Quelle benutzt werden. Das direkte, zugriffsaneignende Einbinden in fremde Seiten oder Rahmen ist nicht gestattet. Zitate und Links sind natürlich erwünscht. Sofern die Rechte anderer berührt sind, sind diese dort zu erkunden. Sollten wir die Rechte anderer unberechtigt genutzt haben, bitten wir um Mitteilung. Soweit es um (längere) Zitate aus ... geht, sind die Rechte bei/m ... zu erkunden oder eine Erlaubnis einzuholen.
Ende_ q03_f_Datenschutz_Überblick _ Relativ Aktuelles _ Rel. Beständiges _ Titelblatt _ Konzept _ Archiv _ Region _ Service iec-verlag _ Mail: _ sekretariat@sgipt.org _
___Wichtige Hinweise zu Links und Empfehlungen
14.05.2015 Linkfehler geprüft und korrigiert, Layout-Anpassung.