Internet Publikation für Allgemeine und Integrative Psychotherapie
IP-GIPT DAS=12.10.2007 Internet-Erstausgabe, letzte Änderung 13.10.7
Sekretariat: Diplom-PsychologInnen Irmgard Rathsmann-Sponsel und Dr. phil. Rudolf Sponsel
Stubenlohstr. 20  3147  D-91019 Erlangen * Mail: sekretariat@sgipt.org_Zitierung & Copyright
Anfang_VUS 1975-2000_ Überblick  _ Relativ Aktuelles  _Rel. Beständiges  _Titelblatt  _Konzept  _Archiv  _Region _Service iec-verlag _Wichtige Hinweise zu Links und Empfehlungen
Willkommen in der Abteilung Wissenschaftstheorie, Methodologie und Statistisch-Mathematische Methoden in der Allgemeinen und Integrativen Psychologie, Psychodiagnostik und Psychotherapie, hier:
Multivariate Kollinearitäts- (Eigenwert-) , Hauptkomponenten- und Faktorenanalyse der Verkehrsunfallstatistik 1975-2000

von Rudolf Sponsel, Erlangen

Faktorenanalysen können sinnvoll sein - wenn die Daten stimmen.
_

Inhaltsübersicht
Zusammenfassung, Abstract, Summary.
1. Nebenergebnis numerische Instabilität.
2. Nebenergebnis: Massive "Heywood-Case" Entgleisung bei der Kaiser-Iteration.
Die Rohdaten
Fast-Kollinearitäts-Analyse mittels Eigenwertanalyse
Partielle Korrelationsanalyse.
Die Faktorenanalysen:
Multivariate Analyse der 6 Variablen mit 9- und 15-Nachkommastellen eingelesen.
Multivariate Analyse der  4 Variablen mit 15-Nachkommastellen eingelesen.
Literatur und Links.
Glossar, Anmerkungen und Endnoten: * B.A.D.S. * Begriffserläuterungen für den Bereich Verkehrsunfälle * Datenquelle * Relationentreue * Querverweise * Zitierung * Änderungen

Zusammenfassung, Abstract, Summary.
Es wurde eine Multi-Kollinearitäts- (Eigenwerts-), Hauptkomponenten- und Faktorenanalyse der Verkehrsunfallstatistik von 1975 bis 2000 (26 Jahresangaben) mit den 6 Variablen durchgeführt: V1:= Anzahl der Unfälle mit Personenschäden, V2:= Anzahl der Verunglückten, V3:= Anzahl der Getöteten, V4:= Anzahl der Schwerverletzten, V5:= Anzahl der Leichtverletzten, V6:= Schwerwiegende Unfälle mit Sachschaden. Die Häufigkeitsmatrix der Rohdaten enthält eine rechnerische Kollinearität (V2=V3+V4+V5) so dass die Korrelationsmatrix auf jeden Fall eine konstruktionsbedingte, artefizielle Kollinearität mit Eigenwert 0 enthalten muss. Darüberhinaus enthält die Korrelationsmatrix aber zwei Fast-Kollinearitäten, also zusätzlich zwei Eigenwerte "nahe" 0 und damit zwei echte Fast-Gesetzmäßigkeiten. Es wird gezeigt, dass diese zwei Fast-Kollinearitäten schon im Rahmen der Hauptkomponentenanalyse einer sinnvollen Interpretation zugänglich sind, hier mit den Hauptkomponenten F1:= Verletzungsgrad, F2:=  Personenschaden und F3:= Sachschaden. Damit wird - wieder - ein altes Vorurteil widerlegt, dass die mathematische Hauptkomponentenmethode angeblich nicht interpretierbar sein soll und man deshalb Rotationen (hier: Quartimax, Varimax) oder Faktorenanalysen mit mathematisch nicht interpretierbaren Manipulationen der Hauptdiagonalelemente durchführen muss, wobei die Kommunalitätsmatrix der Faktoren der ursprünglichen Korrelationsmatrix meist nicht einmal mehr ähnlich ist. D.h. reduziert man eine Korrelationsmatrix der Ordnung n auf k < n Faktoren, ohne dass dies die Daten hergeben, so zahlt man für diese Reduktion den Preis, dass die variablen-reduzierte Kommunalitätsmatrix die originale Korrelationsmatrix nicht mehr repräsentiert. Das ist das Dilemma aller Faktorenanalysen, deren zugrunde liegende Daten (Roh- und davon abgeleitete Daten wie z.B. Korrelationen) von vorne herein keine oder nicht genügend Fast-Kollinearitäten enthalten.
    Nachdem V2:= Anzahl der Verunglückten keinen Informationswert hat und V6:= Sachschäden durch die vielen unterschiedlichen Erfassungskriterien ein durch und durch inhomogener Datensatz ist, dessen Korrelationen nicht sinnvoll interpretierbar sind, kann man die Multi-Kollinearitäts- (Eigenwert-), Hauptkomponenten- und Faktorenanalyse auf die vier Variablen V1, V3, V4 und V5 vereinfachen. Die Strukturen werden dadurch noch einfacher und deutlicher sicht- und interpretierbar. Die Korrelationsmatrix hat zwei große Eigenwerte 2.08655 und 1.8345, was hier die zwei unabhängigen Hauptfaktorenkomponenten anzeigt und zwei kleine, "nahe" 0 mit 0.077 und  0.0018, die die zwei Fast-Gesetzmäßigkeiten anzeigen. Betrachtet man sich das Hauptkomponenten-Faktorenladungsmuster, so lädt der 1. Faktor sehr hoch auf den Variablen V3 und V4 (Getötete und Schwerverletzte) und mittelstark auf V5 (Leichtverletzte), sehr schwach auf V1:= den Unfällen mit Personenschaden. Diesen Faktor F1 könnte man als Verletzungsgrad interpretieren. Der zweite Faktor F2 lädt hoch auf V1:= Unfälle mit Personenschaden auf V5:= Leichtverletzte. Diesen Faktor F2 könnte man als allgemeinen Personenschaden deuten.
_

Im vorliegenden Fall lassen sich durch geeignete Umformungen (Getötete*10) und Umstellungen bei den Rohwerten (V1,V5, V3,V4) die zwei Fastkollinearitäten schon im Graph der Rohdaten zeigen, aber auch im Graph der Korrelationen kann man sie sehen:

1. Nebenergebnis numerische Instabilität: analysiert man die 6er-Korrelationsmatrix mit 9-stelligen Eingabedaten, verliert sie aufgrund der enthaltenen echten, wenn auch artefiziellen Kollinearität im Zusammenspiel mit Rundungsfehlern ihre positive Semidefinitheit; analysiert man sie hingegen mit 15-stelligen Eingabedaten, bleibt sie bezüglich der Schranke positiv semidefinit.
2. Nebenergebnis: Massive Heywood-Case Entgleisung der positiv definiten 4er-Korrelationsmatrix bei der Kaiser- und Guttman-Iteration der Kommunalitätsmatrix. Hier werden bei der Guttman- ein und bei der Kaiser-Iteration sogar zwei abenteuerliche "Heywood-Cases" erzeugt mit einer Hauptdiagonalsumme von 6.715471169 (<= 4 wäre bei der Kommunalitätsmatrix korrekt).
    Fazit: Faktorenanalysen können zu sinnvollen Ergebnisse führen, wenn die Rohdaten fast-kollineare Relationen enthalten, die sich in die Korrelationsmatrix hinein abbilden - wenn auch nicht immer relationentreu.



Die Rohdaten [Datenquelle]



Fast-Kollinearitäts-Analyse mittels Eigenwertanalyse [nach Sponsel 2005]
[Intern, Parameter # file= vus75_00.D04EV4MC4AB,  # org_proz:    20   20   0  0.0001 -1,  # Eigenwerte aus Datei vus75_00.D04EV4MC4]

A = gibt die Anzahl der Fast-Kollinearitäten der Variablen in der Partition an, B gibt die Anzahl der Nicht Fast-Kollinearitäten  an. C gibt echte Kollinearitäten an (Eigenwert = 0). A und B ergänzen sich zur Anzahl der betrachteten Variablen. Da die Ausgangs-Korrelationsmatrix der vier Variablen V1:= Anzahl der Unfälle mit Personenschäden, V3:= Anzahl der Getöteten, V4:= Anzahl der Schwerverletzten und V5:= Anzahl der Leichtverletzten zwei Fast-Kollinearitäten enthält, gilt:

part:    1   3   4   5 .   0     A=2   B=2   C=0  0.20,

wobei 0.20 die gewählte absolute Grenze für die Fast-Kollinearität angibt: Eigenwert <= 0,20, hier 1/20 der Eigenwertsumme 4 der Korrelationsmatrix mit Ordnung 4.
 

Es gibt zwei Paare, die eine Fast-Kollinearität enthalten:
part:    1   5 .   3   4     A=1   B=1   C=0  0.20 Zwischen Unfällen mit Personenschaden und Leichtverletzten.
part:    3   4 .   1   5     A=1   B=1   C=0  0.20 Zwischen Getöteten und Schwerverletzten

Alle vier Tripel enthalten eine Fast-Kollinearität:
part:    1   3   4 .   5     A=1   B=2   C=0  0.20
part:    1   3   5 .   4     A=1   B=2   C=0  0.20
part:    1   4   5 .   3     A=1   B=2   C=0  0.20
part:    3   4   5 .   1     A=1   B=2   C=0  0.20

Die folgenden Paare enthalten keine Fast-Kollinearität:
part:    4   5 .   1   3     A=0   B=2   C=0  0.20
part:    3   5 .   1   4     A=0   B=2   C=0  0.20
part:    1   4 .   3   5     A=0   B=2   C=0  0.20
part:    1   3 .   4   5     A=0   B=2   C=0  0.20

Eigenwertanalyse aller Partitionen  (drinnen . draußen)
part:    1   3   4   5 .   0  eig:   0.0771478     0.00180619      1.8345      2.08655

part:    3   4   5 .   1     eig:     0.0560092      0.862853          2.08114
part:    4   5 .   1   3     eig:     1.25184          0.748156
part:    3   5 .   1   4     eig:     1.29471          0.705289
part:    3   4 .   1   5     eig:     0.0570716      1.94293
part:    1   4   5 .   3     eig:     1.12321          1.86548           0.0113023
part:    1   5 .   3   4     eig:     0.134578        1.86542
part:    1   4 .   3   5     eig:     0.758125        1.24188
part:    1   3   5 .   4     eig:     1.07547          1.8827             0.0418328
part:    1   3 .   4   5     eig:     0.874868        1.12513
part:    1   3   4 .   5     eig:     0.940528        0.0496226       2.00985



Partielle Korrelationsanalyse [Info]
Die partielle Korrelation simuliert die experimentelle Technik des Konstanthaltens: der Einfluss der auspartialisierten Variable wird ausgeschaltet ("Eliminationsmethode"), eine für viele Fragestellungen sehr nützliche Methode.

Partialisiert man aus den drei Variablen V1 (Unfälle mit Personenschaden), V3  (Getötete) und V4 (Schwerverletzte) die Variable V4 aus, so fällt die ursprüngliche Korrelation zwischen V1 und V3 von  r13 = 0.125132 um 0.443721 auf  r13.4 = -0.318589. Der Zusammenhang wird von sehr schwach positiv merklich negativer. Die stärkste Veränderung ergibt sich bei p35.14, wenn also die Variablen 1 und 4 auspartialisiert werden mit einer Differenz von  -1.174452.  Die Korrelation steigt von ursprünglich -0.294711 auf 0.879741 an. Hier stellt sich aber nach den mathematischen Untersuchungen von Hain (1994, Kap. 6., S.35) die Frage, ob diese partiellen Korrelationen überhaupt zuverlässig sind, weil die partielle Korrelationsmatrix alle gegen den Rest nicht notwendig positiv semidefinit ist. Diese Frage muss leider noch offen bleiben.


Die Faktorenanalysen

Multivariate Analyse der 6 Variablen mit 9- und 15-Nachkommastellen eingelesen

Zum einfacheren direkten Vergleich wurden beide Varianten einander gegenübergestellt. Die Hauptkomponentenmethode ist das mathematisch grundlegende und sichere Verfahren. Faktorenanalysen, die die Hauptdiagonalelemente beschneiden oder auch sonst keine angemessene Repräsentation der ursprünglichen Korrelationsmatrix erlauben, weil sie völlig entgleiste und absurde Werte produzieren (wie z.B. "Heywood-Case", multiple Korrelationskoeffizienten mit einem Vielfachen von 1 oder imaginäre Werte oder Datensätze).


 

Multivariate Analyse der  4 Variablen mit 15-Nachkommastellen eingelesen



Literatur und Links (Auswahl)
Harman, Harry H. (1970). Modern Factor Analysis. Chicago: The University of Chicago Press. [Anmerkung: Die Kaiser- und Guttman Iteration wird im chap. 5.5 "The Problem Of Communality", p. 82-83 abgehandelt. Nach diesen Angaben wurden die Iterations-Varianten Kaiser und Guttman programmiert und von Wiesent verbessert durch Erzwingung positiver Semidefinitheit]
Sponsel, Rudolf & Hain, Bernhard (1994). Numerisch instabile Matrizen und Kollinearität in der Psychologie. Diagnose, Relevanz & Utilität, Frequenz, Ätiologie, Therapie. Ill-Conditioned Matrices and Collinearity in Psychology. Deutsch-Englisch. Übersetzt von Agnes Mehl. Kapitel 6 von Dr. Bernhard Hain: Bemerkungen über Korrelationsmatrizen. Erlangen: IEC-Verlag [ISSN-0944-5072  ISBN 3-923389-03-5].
Bd. 2.: Sponsel, R. (2005). Fast- Kollinearität in Korrelationsmatrizen mit Eigenwert-Analysen erkennen Ergänzungsband - Band II zu Numerisch instabile Matrizen und Kollinearität in der Psychologie. Erlangen: IEC-Verlag.



Glossar, Anmerkungen und Endnoten:
1) GIPT= General and Integrative Psychotherapy, internationale Bezeichnung für Allgemeine und Integrative Psychotherapie.
___
B.A.D.S. Bund gegen Alkohol und Drogen im Straßenverkehr e.V. (B.A.D.S.). Der B.A.D.S. ist Herausgeber der wissenschaftlichen Zeitschrift BLUTALKOHOL, in der für die juristische und medizinische Praxis verkehrspolitische, juristische und medizinische Beiträge sowie aktuelle Forschungsergebnisse zur Wirkungsweise von Alkohol und Drogen auf die Fahrtauglichkeit veröffentlicht werden.
___
Begriffserläuterungen für den Bereich Verkehrsunfälle
[Version: 2.24.0 / 31.08.2007]
Alleinunfall. Als Alleinunfälle gelten Unfälle, an denen nur ein Fahrzeug beteiligt ist. Es können jedoch mehrere Insassen verunglücken.
Beteiligter. Als Beteiligte an einem Straßenverkehrsunfall werden alle Fahrzeugführer oder Fußgänger erfaßt, die selbst oder deren Fahrzeug Schäden erlitten oder hervorgerufen haben. Verunglückte Mitfahrer zählen somit nicht zu den Unfallbeteiligten.
Fahrzeugbenutzer. Es werden die Fahrzeugbenutzer der unfallbeteiligten Fahrzeuge, also die verletzten und unverletzten Personen in oder auf dem Fahrzeug, ausgezählt. Mit diesen Angaben lassen sich nicht nur durchschnittliche Fahrzeugbesetzungen errechnen. Das Verhältnis von potentiell gefährdeten (Fahrzeugbenutzer) zu wirklich verletzten oder getöteten Verkehrsteilnehmern gibt Aufschluß über die Verletzungsrisiken bei den einzelnen Verkehrsbeteiligungsarten.
Getötete. Personen, die innerhalb von 30 Tagen an den Unfallfolgen starben
Hauptverursacher. Der Hauptverursacher (1. Beteiligter) ist der Beteiligte, der nach Einschätzung der Polizei die Hauptschuld am Unfall trägt. Beteiligte an Alleinunfällen gelten immer als Hauptverursacher.
Leichtverletzte. Alle verletzten Personen, die weder getötet noch schwerverletzt wurden.
Schwerverletzte. Personen, die unmittelbar zur stationären Behandlung (mindestens 24 Stunden) in einem Krankenhaus aufgenommen wurden.
Schwerwiegende Unfälle mit nur Sachschaden i.e.S.  Schwerwiegende Unfälle mit nur Sachschaden i.e.S. sind Unfälle, bei denen als Unfallursache eine Ordnungswidrigkeit (Bußgeld) oder Straftat im Zusammenhang mit der Teilnahme am Straßenverkehr vorliegt, und bei denen gleichzeitig ein Kraftfahrzeug aufgrund eines Unfallschadens von der Unfallstelle abgeschleppt werden muss (Kfz nicht fahrbereit), dies betrifft auch Fälle mit Alkoholeinwirkung.
sonstige Geschädigte. Sonstige Geschädigte sind Personen, die Sachschäden erlitten haben, aber nicht als Verkehrsteilnehmer in den Unfall verwickelt sind (z.B. Hausbesitzer, Träger von Verkehrseinrichtungen usw.). Sie werden in der Unfallstatistik nicht gezählt.
sonstiger Alkoholunfall. Sonstige Sachschadensunfälle sind Unfälle, bei denen ein Unfallbeteiligter unter Alkoholeinwirkung stand.
übriger Sachschadensunfall. Alle übrigen Sachschadensunfälle werden nur zahlenmäßig nach der Ortslage (innerorts, außerorts, auf Autobahnen) nachgewiesen. Dabei wird die Ortslage der Unfälle durch die gelben Ortstafeln bestimmt. Alle Unfälle auf Autobahnen, auch die auf Stadtautobahnen, gelten als Unfälle außerhalb von Ortschaften. Bei Unfällen auf Kreuzungen wird die höherrangige Straße eingetragen.
Unfall. Unfälle werden unterschieden nach der Schwere der Unfallfolgen, z.B. Unfälle mit Personenschaden, schwerwiegende Unfälle mit Sachschaden im engeren Sinne (i.e.S.), sonstige Alkoholunfälle sowie übrige Sachschadensunfälle. Kriterium der Zuordnung ist jeweils die schwerste Unfallfolge, d.h. bei einem Unfall mit nur Sachschaden sind keine Verkehrsteilnehmer verunglückt.
Unfall mit Personenschaden. Unfälle mit Personenschaden sind solche, bei denen unabhängig von der Höhe des Sachschadens Personen verletzt oder getötet wurden.
Unfallursachen. Die Unfallursachen werden von den aufnehmenden Polizeibeamten entsprechend ihrer Einschätzung in das Erhebungspapier eingetragen. Es wird unterschieden nach allgemeinen Ursachen (u.a. Straßenverhältnisse, Witterungseinflüsse, Hindernisse), die dem Unfall und nicht einzelnen Beteiligten zugeordnet werden, sowie personenbezogenem Fehlverhalten (wie Vorfahrtsmissachtung, zu schnelles Fahren usw.), das bestimmten Fahrzeugführern oder Fußgängern, d.h. den Beteiligten zugeschrieben wird.
Verunglückte. Als Verunglückte zählen Personen (auch Mitfahrer), die beim Unfall verletzt oder getötet wurden.
___
Datenquelle.
Primär-Quelle: Straßenverkehrsunfälle unter Einfluss anderer berauschender Mittel (z.B. Drogen, Rauschgift) und dabei Verunglückte 1975 – 2000. 2002, Statistisches Bundesamt: Wiesbaden.
Sekundär-Quelle: http://bads.de/Downloads/DROGENUNFAELLE.XLS
___
Relationentreue  [aus Sponsel 1994, Kap. 1, 15-16]:


___


Querverweise
Standort: [Faktorenanalyse] VUS 1975-2000.
*
Korrelation * Partielle Korrelation * Eigenwertanalyse/Fast-Kollinearität * Überblick Statistik * Verkehrsunfallstatistik: 2007, 2006.
Überblick der Dokumentationen zur Handhabung der Faktorenanalyse
Kritik der Handhabung der Faktorenanalyse
Was für ein Typ Matrix entsteht durch Faktorenanalysen?
Überblick Numerisch Instabile Matrizen und Kollinearität in der Psychologie
Zahlenmystik und numerologische Esoterik in Statistik und Testtheorie
Überblick Arbeiten zur Definitionslehre, Methodologie, Meßproblematik, Statistik und Wissenschaftstheorie
*
Suchen in der IP-GIPT, z.B. mit Hilfe von "google": <suchbegriff> site:www.sgipt.org
z.B. Faktorenanalyse site:www.sgipt.org
*
Dienstleistungs-Info.
*


Zitierung
Sponsel, Rudolf  (DAS). Multivariate Kollinearitäts- (Eigenwert-) , Hauptkomponenten- und Faktorenanalyse der Verkehrsunfallstatistik 1975-2000. IP-GIPT. Erlangen: http://www.sgipt.org/wisms/fa/verkehr/vus75_00.htm
Copyright & Nutzungsrechte
Diese Seite darf von jeder/m in nicht-kommerziellen Verwertungen frei aber nur original bearbeitet und nicht  inhaltlich verändert und nur bei vollständiger Angabe der Zitierungs-Quelle benutzt werden. Das Einbinden in fremde Seiten oder Rahmen, die die Urheberschaft der IP-GIPT nicht jederzeit klar erkennen lassen, ist nicht gestattet. Sofern die Rechte anderer berührt sind, sind diese dort zu erkunden. Sollten wir die Rechte anderer unberechtigt genutzt haben, bitten wir um Mitteilung. Soweit es um (längere) Zitate aus  ...  geht, sind die Rechte bei/m ... zu erkunden oder eine Erlaubnis einzuholen.

 

  Ende_VUS 1975-2000_ Überblick  _ Relativ Aktuelles  _ Rel. Beständiges  _ Titelblatt  _ Konzept  Archiv  _ Region _ Service iec-verlag _ Mail: sekretariat@sgipt.org  _Wichtige Hinweise zu Links und Empfehlungen

kontrolliert am: 13.10.2007 irs


Änderungen wird gelegentlich überarbeitet, ergänzt und vertieft * Anregungen und Kritik willkommen
00.00.00