iec-verlag1)

    Psychologische, Psychodiagnostische und Psychotherapeutische Dienstleistungen und Wissenschaftsdienst des iec-verlages und der Psychologisch-Psychotherapeutischen Praxis Rathsmann-Sponsel & Sponsel
     

    Fast- Kollinearität in Korrelationsmatrizen mit Eigenwert-Analysen erkennen

    Ergänzungsband - Band II zu

    "Numerisch instabile Matrizen und Kollinearität in der Psychologie
    - Ill-Conditioned Matrices and Collinearity in Psychology -
      Diagnose, Relevanz & Utilität, Frequenz, Ätiologie, Therapie"
     

    Graph der fast-kollinearen Korrelationskoeffizienten Vital-Ich (8), Real-Ich (11),
    Selbstbewußtsein (13), Selbstwertgefühl (14), Selbstvertrauen (17) und Selbstverwirklichung (18)
    im Integrativen Persönlichkeits-Fragebogen IPF


     

    ISSN-0944-5072  * ISBN 3-923389-13-2
    WIRE-O-Ringbindung DIN A4
    Preis 29,80 Euro

    * Inhaltsverzeichnis  * Abstract/Zusammenfassung/Summary * Abstract/Zusammenfassung am Beispiel IPF * Literatur * Querverweise *


    Inhaltsverzeichnis

    Vorwort und Danksagung 5

    Abstract - Zusammenfassung - Summary 6
    Definition Fast-Kollinearität 6
    Die Korrelationsrechnung 6
    Abstract - Zusammenfassung am Beispiel Fast-Kollinearität im IPF 7

    Interpretations-Regeln zu Korrelationsmatrizen   8
    Verschiedene Korrelationskoeffizienten 8
    Unabhängigkeitsregel 9
    Unkorreliertheitsregel 9
    Linearitätsregel 9
    Anmerkung: Tücken und Fallen pseudolinearer Zusammenhänge 9
    Vieldeutigkeitsregel 9
    Relevanter Merkmalsraum 9
    Isometriesatz 10
    Entgleiste Korrelationsmatrizen. 10
    Eigenwerte und Korrelationsmatrix 10
    Exkurs: Fallen und Tücken pseudokollinearer Korrelationsmatrizen 11
    Verwirrende multiple Korrelationskoeffizienten bei Artefakten 11

    Kollinearität und Fast-Kollinearität in dieser Arbeit   12
    Voll- und Fast-Kollinearitäten in einer Korrelationsmatrix 13
    Was heißt nun (Fast-) Kollinearität in Korrelationsmatrizen praktisch? 13
    Praktische Fast-Kollinearitäts-Findungsmethoden für Korrelationsmatrizen: 14
    Gesamtmaß der Fast-Kollinearität einer Korrelationsmatrix. 16
    Wie viele Partitionen gibt es in einer Korrelationsmatrix der Ordnung n? 16
    Wie viele Fast-Kollinearitäten K können in einer Partition vom Umfang m sein? 16
    Wie viele Fast-Kollinearitäten gibt es in einer Korrelationsmatrix? 16
    Maximale Fast-Kollinearitäten in Teilmatrizen 17
    Berechnung der maximalen Fast-Kollinearitäten für Partitionen (MKP) 17

    Auswertungs-, Such-, und Interpretations-Methoden der Fast-Kollinearität   18
    Fast-Kollinearitätsregeln 18
    Was heißt, eine Partition ist (fast-) kollinear? 18
    Was heißt „unabhängige Variable“? 18
    Kann man „unabhängige Variable“ in einer Korrelationsmatrix finden? 19
    Was heißt abhängige Variable und wie kann man sie in einer Korrelationsmatrix finden? 19
    Welcher Zusammenhang besteht zwischen unabhängigen bzw. abhängigen Variablen und fast-kollinearen bzw. nicht fast-kollinearen Variablen? 19
    Tripel-Analyse 19
    Interpretationsschlußweisen 19

    Vorüberlegungen zu möglichen allgemeinen Algorithmen (in Quasi-Code)   19
    Die Herausnahme oder Hinzunahme einer Variablen zu einer Gruppe kann theoretisch drei Wirkungen haben: 20
    Die Bedeutung der Herausnahme einer Variablen aus einer Gruppe: 20
    Die Bedeutung der Hinzunahme einer Variablen zu einer Gruppe: 20
    Such-Methodik 20
    Erste Stufe. 21
    Zweite Stufe. 21
    Ungereimtheiten, Unverstandenes und offene Fragen zur Fast-Kollinearität 22

    Matrizen Beispiele zur Fast-Kollinearitätsanalyse   23

    Extrembeispiele, Sonder- und Grenzfälle   24
    1. Die Einheitsmatrix als Korrelationsmatrix interpretiert 24

    • In-Out-Eigenwertanalyse der Einheitsmatrix als Korrelationsmatrix 24
    • Zusammenfassung Einheitsmatrix 24
    2. Die Plus-Eins-Matrix als extreme Korrelationsmatrix interpretiert 25
    • In-Out-Eigenwertanalyse der Plus-Eins-Matrix als Korrelationsmatrix 25
    3. Konsistent Alternierende Plus-Minus-Eins-Matrix 26
    4. Die vollständige Minus-Eins-Matrix ist keine Korrelationsmatrix 26
    5. Die Minus-Eins-Matrix mit Hauptdiagonale je 1 ist keine Korrelationsmatrix 27
    6. Die Null-Matrix ist keine Korrelationsmatrix 27

    Analyse einer „pseudo“-linearen Matrix   28
    Die Korrelationen 29
    Faktorenanalysen von 1-9 und Reproduktionsgüten zwischen Ursprungsmatrix
    und der durch die Faktoren reproduzierten Matrix 29
    Fast-Kollinearitätsanalyse der Gesamtmatrix und ihrer Partitionen 29
    Zusammenfassung In-Out-Eigenwertanalyse „pseudo“-lineare Korrelationsmatrix 29

    Analyse der „pseudo“-linearen Matrix mit vollem Wertebereich   30
    Die Korrelationen 30
    Faktorenanalysen von 1-9 und Reproduktionsgüten zwischen Ursprungsmatrix und der durch die Faktoren reproduzierten Matrix 30
    Fast-Kollinearitätsanalyse der Gesamtmatrix und ihrer Partitionen 31
    Fast-Kollinearitätsanalysen einiger Partitionen: Paare und Tripel 31
    Zusammenfassung In-Out-Eigenwert-Analyse 31

    Analyse einer „Norm-Matrix“ (Norm500.K16)    32
    Die Gretchenfrage: was ist die Grenze für Fast-Kollinearität anzeigende Eigenwerte? 32
    Erzeugung der Rohdatensätze (500*16) 32
    Generalfaktormodell (Spearman ) 32
    Dokumentation und Darstellung der „Norm-Matrix“ 33
    Die ersten 10 absoluten Rohwert-Datensätze mit ihrem Erzeugungsprinzip 33
    Die ersten 10 Rohwert-Datensätze nach Abweichungsprozenten dargestellt 33
    Korrelationstabelle der Norm-Matrix  (N=500, V=16) 35
    Eigenwerte der Norm-Matrix und ihre Korrelation mit den Fehlerprozenten 36
    In-Out-Eigenwert-Analyse im Vergleich relative und absolute Eigenwert-Grenzen 37
    Zusammenfassung In-Out-Eigenwertanalyse der Norm-Matrix 40
    Korrelationen Relativkriterien, Eigenwerte, Abweichungsprozente, Absolutkriterien 40
    Fast-Kollinearitäten in den einzelnen Partitionen im Vergleich 41
    Vergleichende Zusammenfassung aller Paar- und Tripel- Partitionen 52
    Warnung: Die Tücken und Fallen eines Relativkriteriums 53

    Analyse einer Rechteck-Matrix (RE50_5) zur Frage Erkennen unabhängiger Variabler   54
    ABC-Auswertung der Fast-Kollinearitäten 55
    Ergänzung In-Out-Eigenwert-Analyse der RE50_5 55
    In-Out-Zusammenfassung 56
    Faktorenanalysen von 1-5 und Reproduktionsgüten zwischen Ursprungsmatrix
    und der durch die Faktoren reproduzierten Matrix 56

    Thurstone Trapezoid - Anwendung auf ein historisches Beispiel   57
    Original Text Thurstones 57
    Berechnete Rohwerte von Thurstone's Trapezoid (hier zweistellig wiedergegeben) 59
    Faktorenanalysen von 1-16 und Reproduktionsgüten zwischen Ursprungsmatrix
    und der durch die Faktoren reproduzierten Matrix 59
    In-Out-Analyse des Thurstone’schen Trapezoiden 60
    Zusammenfassung In-Out-Eigenwertanalyse 60

    Analyse des Integrativen Persönlichkeitsfragebogens IPF    61
    Eigenwerte und multiple Korrelationskoeffizienten beim IPF 61
    Ergebnisse der 25 Faktorenanalysen und der Vergleiche zwischen der Original-Korrelationsmatrix und der aus den 1-25 Faktoren reproduzierten Matrizen: 62
    Die Korrelationsmatrix des IPF (Basis 115 ProbandInnen): 62
    In-Out-Eigenwertanalyse  IPF25 für die Partitionen 2 bis 10 aus 25 mit eig < 0,20 63
    Vorbemerkung zur Zusammenfassung In-Out-Eigenwert-Analyse 65
    Tabellarische Zusammenfassung In-Out-Eigenwert-Analyse des IPF 66
    Fast-Kollinearitätsanalysen einiger Partitionen: Paare und Tripel 66
    Fast-kollineare Paare im IPF (2) 66
    Neue Fast-kollineare Tripel im IPF (7) 66
    Fast-kollineare Tripel im IPF, die auf die fast-kollinearen Paare zurückgehen 67
    Zusammenfassung und Interpretation der Paar- und Tripelanalyse der Fast-Kollinearität im Integrativen Persönlichkeitsfragebogen IPF 68

    Analyse des AD-H-D Tests 69
    Eigenwerte der AD-H-D Korrelationsmatrix N=444 V=115 70
    Multiple Korrelationen und Eigenwerte der eigentlichen AD-H-D-Werte ohne Mittel 71
    115 Faktorenanalysen und reproduzierte Korrelationsmatrizen 72
    Aufspüren Fast-Kollinearitäten im AD-H-D-Test gelingt weitgehend nicht. 73
    Auswahl aus V=113 nach dem Kriterium mulcor > 0,80 führt zu Reduktion auf 56 73
    Zusammenfassung In-Out-Fast-Kollinearitätsanalyse mcor >0,80 mit V=56 73
    Überraschende und verwirrende multiple Korrelationskoeffizienten bei artefizieller Kollinearität in der AD-H-D-Matrix? 74

    Anhang:
    Anhang 1: Kombinatorik der Partitionen, Kollinearitäten und beteiligten Variablen in der Korrelationsmatrix 75
    Anhang 2: Tabelle Partitionen, Maximale Kollinearitäten und beteiligte Variable 76
    Anhang 3: Tabelle Maximale Fast-Kollinearitäten cumkol in Partitionen i aus n 77
    Anhang 4:  Schranken für Eigenwerte in Abhängigkeit nach Ordnung und Grenzen 78
    Anhang 5: Berichtigung zum Thurstone’schen Trapezoiden (1994, Kap. 7.3) 79
    Korrigiertes OMIKRON-Basic-Programm zur Berechnung der Parameter des THURSTONEschen Trapezoids (k) 79
    Berichtigte Standard-Matrix-Analyse vom 22.10.2002 80
    Anhang 6: Kurz-Charakterisierungen der Variablen (Dimensionen) im IPF 82
    Anhang 7: Literaturhinweise und Links 85

    Abbildungen und Graphen
    Abb. 01  Kollinearität im IPF  S. 7
    Abb. 02  Eine Korrelationsformel S. 8
    Abb. 03  Pseudolineare Funktionen und Korrelationen  S. 28
    Abb. 04  Der Werteverlauf der ersten 10 Datensätze der „Norm-Matrix“  S. 34
    Abb. 05  Der Werteverlauf in Abweichungsprozenten der ersten 10 Datensätze der „Norm-Matrix“  S. 34
    Abb. 06  Veränderung der absoluten Mittelwerte und der Veränderungsprozente S. 35
    Abb. 07  Thurstones Trapezoid nach seinen Angaben S. 58
    Abb. 08  Graph des sAin-Werte Verlaufs  S. 60
    Abb. 09  Graph des Eigenwertgrößenverlaufs S. 60
    Abb. 10  Fast-Kollinearität zwischen Real-Ich, Selbstbewußtsein und S-Typ S. 68


    Abstract - Zusammenfassung - Summary  [Fehlerkorrekturseite]
    Diese Arbeit stellt eine Untersuchungsmethodik vor, wie man Gesetzmäßig- und Regelhaftigkeiten von Variablen durch Analyse der zugehörigen Korrelationsmatrizen aufspüren und im Detail analysieren kann. Solche Gesetzmäßig- und Regelhaftigkeiten kann man auch als quasifunktionale lineare Zusammenhänge bezeichnen, die sich als Fast-Kollinearität zeigen. So gesehen ist das Ziel, die Variablen und Variablenpartitionen (Teilmatrizen), die für die Fast-Kollinearität verantwortlich sind, herauszufinden. Der praktische Nutzen ist offensichtlich: Wenn man weiß, daß eine Variable x mit y und z fast-kollinear zusammenhängt, hat man eine Gesetzmäßig- oder Regelhaftigkeit gefunden, was z.B. in der Psychologie und in den Sozialwissenschaften einen qualitativen Quantensprung der Erkenntnismöglichkeiten bedeuten könnte. Dies wird an einem empirischen Beispiel - dem Integrativen Persönlichkeitsfragebogen (IPF) - ausführlich demonstriert und dokumentiert. Zudem werden zahlreiche Beispiele, auch Extrem-, Sonder- und Grenzfälle vorgestellt, die die Möglichkeiten, Gefahren, Fallen und Tücken der fast-kollinearen Korrelationsanalyse demonstrieren. Der Wert der Methode wird zudem an einem historischen Beispiel, an Thurstones Trapezoid, untersucht.

    Definition Fast-Kollinearität
    Eine Korrelationsmatrix mit Rangdefekt oder vollem Rang und Eigenwerten < Grenze heißt fast-kollinear. Da mehrere Eigenwerte diese Bedingung erfüllen können, umfaßt der Fast-Kollinearitätsbegriff in dieser Arbeit auch den in der - vor allem ökonometrischen - Literatur (Belsley et al.) häufig verwendeten Begriff der Multikollinearität, womit üblicherweise gemeint ist, daß in einer Matrix nicht nur eine (Fast-) Kollinearität enthalten ist, sondern mehrere, also mindestens zwei. (Fast-) Kollinearität kann in dieser Arbeit also auch (Fast-) Multikollinearität bedeuten. Aus praktischen Gründen umfaßt der hier definierte Begriff der Fast-Kollinearität auch die „echte“ Kollinearität. Eine fast-kollineare Matrix kann also auch echt kollinear sein. Fast-Kollinearitäts-Zählungen werden in dieser Arbeit mit A bezeichnet, echte [FN2] Kollinearitäts-Zählungen mit C und keine Fast-Kollinearität mit B. Es gilt hier C <= A.

    Die Korrelationsrechnung
    Korrelieren bedeutet ein Vierfaches: (1) Rohdaten erzeugen, (2) Zentrieren der Rohdaten (X - Mittelwert), (3) Normieren der zentrierten Werte (auf die Standardabweichung 1) und (4) Korrelieren. Mit der Korrelationsmatrix sind dann noch weitere (5) ... multivariate Verarbeitungen (z.B. partielle, multiple und kanonische Korrelation, Faktorenanalyse, Diskriminanzanalyse, kanonische Korrelation) und Matrizenoperationen der linearen Algebra möglich (z.B. Cholesky-Zerlegung, Hauptkomponentenanalyse, Erhard-Schmidtsche Orthogonalisierung). Jede Transformation birgt die Möglichkeit und Gefahr, daß ursprüngliche Relationen verändert bzw. vorher nicht vorhandene neu erzeugt werden [FN3] .

    Abstract/Zusammenfassung am Beispiel IPF



    Literaturhinweise
  • Belsley, David A.; Kuh, Edwin & Welsch, Roy. E. (1980). Regression Diagnostics. Identifying Influential Data and Sources of Collinearity. New York: Wiley.
  • Cattell, R. B. (1966). The scree test for the number of factors. Multivariate Behaviorial research, 1, 140-161: hierzu: Screetest:  https://www.sgipt.org/wisms/fa/scree.htm.
  • Eckart, C. & Young, G. (1936). The Approximation Of One Matrix By Another Of Lower Rank. Psychometrika 1,3, pp. 211-218.
  • Encyclopedia of Statistical Science (1982). Correlation. Vol. 2, pp. 195-204. New York: Wiley.
  • Hain, Bernhard (1994). Bemerkungen über Korrelationsmatrizen. In: Sponsel, R. (1994), Kap. 6.
  • Hart, B., Spearman, C. (1912-1913). General Ability, Its Existence And Nature. The British Journal of Psychology, V, p.54, Table I. Die dort veröffentlichte Korrelationsmatrix ist indefinit; „Therapie“ siehe bitte unter: https://www.sgipt.org/wisms/nis/sma/speahartd.htm.
  • Sponsel, Rudolf (1984). Probleme vollständiger Partialisierung. In: Lebens- und Selbstzufriedenheit als Psychotherapieerfolgskontrolle, 213-230. Praktische Systematik psychologischer Behandlungsforschung. Dissertation. Erlangen: IEC-Verlag.
  • Sponsel, Rudolf (1994). Numerisch instabile Matrizen und Kollinearität in der Psychologie [Ill-Conditioned Matrices and Collinearity in Psychology]. Diagnose, Relevanz & Utilität, Frequenz, Ätiologie und Therapie. Lose-Blatt-Sammlung (A5 Ringordner mit Schuber und 10-teiligem Kunststoffregister). Erlangen: IEC-Verlag. [ISSN 0944-5072 * ISBN 3-923389-03-5].
  • Sponsel, Rudolf (2002). AD-H-D-Testsystem (4 Bde.): Testtheorie und Handanweisung zum AD-H-D-Test für Erwachsene (Manual). * Sonderausgabe 124 Interkorrelationen. * Prozentrangnormen und Kennwerte zur Handanweisung des AD-H-D-Tests für Erwachsene (enthält auch DSM-IV-Rückblick Prozentrangnormen [Schnelltestprüfung]). * Handbuch der AD-H-D-Diagnostik und Differentialdiagnostik bei Erwachsenen. AD-H-D-Test, verbale Grundschul-Zeugnis-Analyse, DSM-IV-Rückblick mit Teil-Leistungs-Schwächen, Alltagsauswirkungen und Lebenszufriedenheitskurve. Differential-diagnostische Diskussion und Fallbesprechungen, auch schwieriger Komorbiditäts-, Grenz- und Problemfälle. Erlangen: IEC-Verlag. Information im Internet: https://www.iec-verlag.de/adhd/adhdtest.htm.
  • Thurstone, L. L. (1947). A trapezoid population. In: Multiple Factor Analysis, p. 427-436. Chicago: The University of Chicago Press. Siehe bitte auch: https://www.sgipt.org/wisms/nis/k7/K7_3k.htm.
  • Thurstone, L. L. (1944). Second-Order Factors, Psychometrika 9, 2, p.96 Table 7 „Correlation Matrix“. [enthält die „Trapezoid“ Matrix mit Druckfehlern] Siehe bitte auch: https://www.sgipt.org/wisms/nis/k7/K7_3k.htm.
  • Wright, R. E. (1939). A Factor Analysis Of The Original Stanford-Binet. Psychometrika, 4,, (3), p. 210-211. Doku: https://www.sgipt.org/wisms/nis/sma/wright.htm.

  • _


    Anmerkungen und Endnoten
    ___
    FN2: Eine C-Zählung verlangt mindestens einen Eigenwert = „0“ wobei beim praktischen numerischen Rechnen berücksichtigt werden muß, daß „reine“ Nullen rundungsfehlerbedingt empirisch selten vorkommen. Wann in diesem Kontext „0“ also „0“ ist, liegt in einer gewissen Grauzone, die im ersten Band „Numerisch instabile Matrizen und Kollinearität in der Psychologie“ genauer erforscht wurde.
    ___
    FN3 Ein bislang sehr vernachlässigtes Thema in der Forschung. Für diese Möglichkeiten haben wir im ersten Band der „Numerisch instabilen ...“ den Begriff der „Relationentreue“ vorgeschlagen: Relationen sollen erhaltungstreu, ausprägungs- und ordnungstreu sein (Kap. 1.4.2). Insbesondere eignet sich das von dem Mathematiker Dr. B. Hain entwickelte Programm PESO (Pivotisiertes Erhard Schmidtsches Orthogonalisierungsverfahren) zum Studium der Relationentreue für die Übergänge Rohdaten => Zentrieren => Normieren => Korrelieren => Cholesky Zerlegung (Kap. 6). Die neuen Ergebnisse der Eigenwertanalysen führen aber zu teilweise anderen Variablenidentifikationen für Fast-Kollinearität, ein Phänomen, das noch untersucht werden muß.


    Änderungen Kleinere Änderungen werden nicht extra ausgewiesen; wird gelegentlich überarbeitet und ergänzt.
    28.05.06    Anwendungsbeispiel: Kollinearitäts-, Eigenwert- und Faktorenanalysen einer Korrelationsmatrix von Revenstorf der 16 Extraversionsfragen nach Brengelmann & Brengelmann.
    19.04.06    Link Fehlerkorrekturseite.
    30.03.06    Ergänzung Literaturliste, Links,  Querverweise.


    Kommunikationsdaten: iec-verlag & Psychologisch-Psychotherapeutische Praxis
    Inhaber: Dipl.-Psych. Dr. phil. Rudolf Sponsel * Geschäftsführung: Dipl.-Psych. Irmgard Rathsmann-Sponsel
    Stubenlohstr. 20  D-91052 Erlangen Fax 09131-27115   Telefon 09131-27111
    bestellung@iec-verlag.de. _Verlagsnummer: 923389 _ sonstiges@iec-verlag.de.


    Querverweise
    Standort: Fast- Kollinearität in Korrelationsmatrizen mit Eigenwertanalysen erkennen.
    [Fehlerkorrekturseite] Anwendungsbeispiel: Kollinearitäts-, Eigenwert- und Faktorenanalysen einer Korrelationsmatrix von Revenstorf der 16 Extraversionsfragen nach Brengelmann & Brengelmann.(28.5.6)
    Numerisch instabilde Matrizen und Kollinearität in der Psychologie.
    * Korrelation * Partielle Korrelation * Statistik und Wissenschaft in der IP-GIPT *
    Verteiler- und Überblicksseite: Fehlersimulation mit Parametern eines Quaders zur explorativen Untersuchung des Verhaltens der Eigenwerte und Faktoren in Abhängigkeit vom variierten Fehlerbereich 1%-50% u.v.a.. * Ergebnisse *
    Einführung und Überblick. Kritik der Handhabung der Faktorenanalyse.
     Korrelationsstudien. Nicht-Linearitäts-Paradox in Korrelationsmatrizen? Mit Erörterungen zur Reproduktionsgüte. Beispieldokumentation und eine Vermutung.
    Screetest:  Dubios. Falsch. Unsinn. Zur Kritik der Faktorenanalyse.
    *
    Informations- und Verteilerseite des iec-verlages.


    kontrolliert


    Zitierung und Impressum
    Impressum: iec-verlag:  Informationsseite zu Bd. 2:  Fast- Kollinearität in Korrelationsmatrizen mit Eigenwertanalysen erkennen.
    Inhaber: Dipl.-Psych. Dr. phil. Rudolf Sponsel       Geschäftsführung: Dipl.-Psych. Irmgard Rathsmann-Sponsel
    Stubenlohstr. 20  D-91052 Erlangen Fax 09131-27115   Telefon 09131-27111
    bestellung@iec-verlag.de_ Verlagsnummer: 923389    sonstiges@iec-verlag.de_
    Ende Informationsseite zu :  https://www.iec-verlag.de/nim/akumk.htm