Die Interpretation in der Faktorenanalyse
insbesondere von Faktorenladungen
[wird bei Gelegenheit mit Grundbedeutungen
vereinigt]
"Der Faktor deutet sich nicht selbst"
Clauß 1982, S. 419
von Rudolf Sponsel, Erlangen
Abstract
- Zusammenfassung - Summary
Das ist ein besonders dunkles und trauriges Kapitel der Faktorenanalyse.
Fragen zur Interpretation
Was bedeutet ein Faktor?
Was bedeutet eine Ladung?
Wann ist eine Ladung hoch oder niedrig oder gar zu vernachlässigen?
Was bedeutet das Vorzeichen bei den Ladungen?
Was bedeutet "erklärte" oder "aufgeklärte" Varianz?
Was bedeutet die Modellvoraussetzung orthogonal?
Was kommt heraus, wenn man orthogonal hineinsteckt?
Was kommt heraus, wenn man nicht orthogonal (oblique, schiefwinklig
= korrellierende Faktoren) hineinsteckt?
Was bedeutet, dass unendlich viele verschiedene Ladungsmatrizen gibt,
die allesamt die Korrelationsmatrix reproduzieren können?
Faktorendeutungsregelm (bs 25.9.12) :
0. Welche Vermutnngen ergeben sich aus der Korrelationsmatrix?
1. Siehe wo Faktorenladungen positiv deutlich bis hoch geladen
sind.
2. Gibt es m relevante Ladungen bei Variablen, so suche das allen
m
Variablen inhaltlich Gemeinsame und benenne
den Faktor danach.
3. Vergewissen durch die Korrelationen der m Variablen.
4. Kontrolle auch durch die negativen Ladungen.
5. Formuliere deutsche Interpretationssätze zu den Ergebnissen.
6. Prüfe auf Verständnis und Plausibilität.
7. Entferne die unwichtigst erscheinende Variable und rechne
neu: entsteht ein
ähnliches Faktorenladungsmuster oder
ein ganz anderes? Falls: was heißt das?
Materialien und Dokumente zur Interpretation der Faktoren/ Ladungen
Die zwei Hauptziele einer Faktorenanalyse sind:
1) Item und Variablenselektion nach Faktorenhypothesen
2) Variablenreduktion durch Faktorenhypothesen
_
Clauß
in Clauß & Ebner (1982, S. 419-428): Zur Interpretation der Faktoren
"19. Zur Interpretation der Faktoren FN1
"Wenn die rotierte Faktormatrix vorliegt, kann man das Ergebnis der
Faktorenanalyse deuten und die für die Fragestellung der Untersuchung
relevante Information aus der Matrix der Ladungen ail entnehmen.
Das ist ein notwendiger, wenn auch schwieriger Schritt.
Die Faktorladungen geben nur an, welche Fragebogen, Tests, Schätzskalen
oder dergleichen in welchem Ausmaß „dasselbe" messen. Was „dasselbe"
aber ist und bedeutet, bedarf der Interpretation durch den Wissenschaftler.
Der Faktor deutet sich nicht selbst. Die verbale Kennzeichnung eines Faktors
ist nicht sprachliches Symbol für das Ladungsmuster, sondern für
eine Eigenschaft, die der Forscher aus dem Ladungsmuster hypothetisch ableitet.
Der Faktor ist Indikator für diese Eigenschaft. Ihre Bezeichnung ist
relativ beliebig. Oft werden Begriffe der Alltagssprache verwendet (z.
B. „Ehrlichkeit", „Selbstvertrauen, Fehlen von Minderwertigkeitsgefühlen"),;
Grundsätzlich kann man auch Zahlen, Buchstaben oder Kunstwörter
zur, Bezeichnung der Faktoren verwenden. Vermeiden sollte man solche Begriffe,
die umgangssprachlich eine sehr weite, unscharfe Bedeutung besitzen (z.
B. „Angst") oder theoretisch in einem spezifischen System festgelegt
sind (z. B. „Introversion" bei C. G. JUNG oder H. J. EYSENCK): in beiden
Fällen sind Mißverständnisse zu befürchten, die durch
den Bedeutungsgehalt der Wortmarken begünstigt werden.
Die Faktoreninterpretation stellt hohe Anforderungen ah die Fachkenntnisse und das wissenschaftliche Verantwortungsbewußtsein des Forschers. Sie kann ihm durch elektronische Datenverarbeitungsanlagen nicht abgenommen werden. Die Umsicht und Bewußtheit beim Deuten der Faktoren entscheidet wesentlich darüber, ob die verfahrensabhängigen Analyseresultate unsere Kenntnis von der Struktur des untersuchten Gegenstandbereiches in verläßlicher Weise erweitern und vertiefen. Unkritisches und voreiliges Vorgehen bei der Faktoreninterpretation führt mit hoher Wahrscheinlichkeit zu falschen Schlüssen. Das ist um so bedenklicher, als diese Schlußfolgerungen häufig kaum angezweifelt, sondern - weil sie anscheinend durch die exakte Methode der Faktorenanalyse gewonnen wurden - zunächst als gültig akzeptiert werden. Mancher Wissenschaftler lehnt die Faktorenanalyse ab, well er aus der Literatur Beispiele kennt, in denen unseriöse Faktorinterpretation zu Schlüssen verleitete, die irreführend oder nachgerade falsch sind. Die Faktorinterpretation läßt sich in drei Teilhandlungen aufgliedern: Inspektion der Faktormatrix und intuitive Deutung der Faktoren, Identifikation von Faktoren, Prüfung der Interpretationshypothesen durch weitere Untersuchungen. Das soll uns nun beschäftigen.
Intuitive Deutung der Faktoren
Wir betrachten die Faktormatrix und fragen uns, was denjenigen Variablen
(z. B. Tests, Fragebögen) gemeinsam ist, die in einem Faktor hohe
Ladungen tragen (|o(,| > 0,5), und was sie von den Variablen mit Nulladungen
(—0,1 < a,i < +0,1) in diesem Faktor unterscheidet.
.
Die hochgeladenen Variablen werden als „Markiervariablen" bezeichnet, während man die sehr niedrig geladenen Variablen „Hyperebenenvariablen" nennt. Die Verteilung der Faktorladungen auf die Variablen heißt dal „Ladungsmuster". Dies entspricht der operationalen Definition eines Faktors, Das Ladungsmuster jedes Faktors ist der Ausgangspunkt für dessen intuitive Deutung.
Beispiel (nach LIENERT und ORLIK, 1968): Fünf verbale Untertests del HAWIE-Intelligenztestes werden von 217 Jugendlichen bearbeitet, die Lösungen nach festgelegten Regeln bewertet und die Leistungen in den Untertests interkorreliert. Nach den Rotationen in drei Faktorebenen ergibt sich folgende endgültige Matrix, die der Interpretation zugrunde liegt. [420]
Aus der Faktormatrix kann man eindeutig und zweifelsfrei entnehmen, wie groß der durch jeden Faktor aufgeklärte Varianzanteil jeder Variablen ist. Darüber informieren die ail2. Je größer deren Summe hi2 (die Kommunalität) für eine Variable ist, desto größer ist der durch die extrahierten Faktoren aufgeklärte Anteil der Varianz. Der Subtest 3 (Rechnerisches Denken) wird durch die gemeinsamen Faktoren fast vollständig aufgeklärt (h32 =98%). Dagegen sagen die drei gemeinsamen Faktoren zur Aufklärung der Varianz im Subist 1 (Gemeinsamkeiten finden) nur wenig bei (h12 = 44%), diese hängt in stärkerem Grade von spezifischen Faktoren ab.
Ebenso eindeutig kann man der untersten Zeile der Matrix entnehmen,
wie groß der Beitrag jedes Faktors zur Aufklärung der Gesamtvarianz
ist. Faktor 2 liefert mit 31 % die meiste Information, die Faktoren 1 und
3 tragen etwa 20% bei. Die drei gemeinsamen Faktoren zusammen klären
folglich rund 71% der Gesamtvarianz auf. Etwa 29% sind auf spezifische
Faktoren und die Fehlervarianz zurückzuführen (Restvarianz).
(
Solche Angaben sind zur Beurteilung der Effizienz einer Faktorenanalyse
wichtig. Sie können objektiv gewonnen werden und unterscheiden sich
auch bei verschiedenen Auswertern nicht, sofern diesen dieselbe Matrix
vorliegt, anders verhält es sich mit der inhaltlichen Deutung der
Faktoren. Dabei ist der subjektive Freizügigkeitsspielraum wesentlich
größer.
Um zu erkennen, was eigentlich durch Faktor 1 gemessen wird, inspizieren
wir das Ladungsmuster dieses Faktors. Dabei suchen wir zunächst diejenigen
Utertests auf, die mit diesem Faktor hoch geladen sind. Das ist die Variable
5 (Allgemeines Verständnis) und die Variable 3 (Rechnerisches Denken).
Was verbindet diese beiden Aufgabengruppen inhaltlich miteinander? Hier
|l!e dort müssen aus vorgegebenen Prämissen Schlußfolgerungen
gezogen erden. Das veranlaßt uns, intuitiv die Hypothese zu bilden,
Faktor 1 habe vas mit „schlußfolgerndem Denken" zu tun. Wir sind
uns der Vorläufigkeit [<421] dieser Annahme wohl bewußt;
denn es gibt sehr, sehr.viele andere Gemeinsamkeiten zwischen beiden Aufgabentypen.
Nun prüfen wir, ob diese Annahme damit vereinbar ist, daß andere
Tests Nulladungen auf diesem Faktor zeigen. Die Nulladung bei Variable
4 (Allgemeines Wissen) verträgt sich mit der Interpretationshypothese,
denn die Reproduktion von Tatsachenkenntnissen dürfte von der Befähigung
zum schlußfolgernden Denken ziemlich unabhängig sein. Etwas
schwieriger ist es, die Nulladung in Variable 1 (Gemeinsamkeiten finden)
mit der Interpretationshypothese in Einklang zu bringen. Es scheint,
als wäre auch zum Finden von Gemeinsamkeiten schlußfolgerndes
Denken unerläßlich. Daher überrascht die Nulladung in diesem
Subtest und stellt in Frage, ob Faktor 1 tatsächlich die Befähigung
zum schlußfolgernden Denken abbildet. Eine genauere Analyse der Aufgabengruppe
,»Gemeinsamkeiten finden" klärt den Widerspruch. Es handelt
sich um sehr einfache Begriffspaare, für die angegeben werden muß,
was ihnen gemeinsam ist. Zum Beispiel gilt bei „Apfelsine - Banane" die
Antwort „Früchte" oder „Südfrüchte" oder „Obst" als richtige
Lösung. Um Aufgaben dieser Art zu lösen, braucht man kaum die
Fähigkeit zum schlußfolgernden Denken. Vielmehr kommt es vor
allem darauf an, sich möglichst viele Merkmale dieser Begriffe bewußt
zu machen und disponibel mit ihnen zu operieren. Das Lösungsverhalten
reduziert sich auf die Bildung von Oberbegriffen. Immerhin entnehmen wir
der Nulladung des Faktors 1 im Untertest 1, daß dieser Faktor offenbar
von sprachlich-begrifflichen Fähigkeiten relativ unabhängig ist.
Faktor 2 ist in den Tests 4 (Allgemeines Wissen) und 2 (Wortschatz)
hoch geladen. Das legt die Annahme nahe, daß dieser Faktor etwas
mit „Wissen", „verbalen Kenntnissen" zu tun habe. Die Leistung in der Variablen
S (Allgemeines Verständnis) wird von Faktor 2 nicht beeinflußt.
Dies verträgt sich mit der Interpretation als verbaler Kenntnisfaktor.
Die mittlere Ladung der Variablen 3 mit diesem Faktor ist plausibel, wenn
man bedenkt, daß es sich um Textaufgaben handelt, die um so sicherer
gelöst werden, je besser die in den Aufgabentexten sprachlich dargestellten
Sachverhalte bekannt sind. Faktor 3 ist in den Untertests 1 (Gemeinsamkeiten
finden), 3 (Rechnerisches Denken) und 5 (Allgemeines Verständnis)
mäßig hoch geladen. Diese drei Aufgabentypen haben gemeinsam,
daß in ihnen sprach logische Zusammenhänge verständnisvoll
erfaßt werden müssen. Diese Fähigkeit wird für Aufgaben
des Tests 2 (Wortschatz) fast nicht benötigt - das vereinbart sich
mit der Nulladung in dieser Variablen - und spielt bei Aufgaben des Tests
4 (Allgemeines Wissen) eine untergeordnete Rolle. Durch Überlegungen
dieser Art fühlen wir uns berechtigt, den Faktor 3 hypothetisch als
„sprachlogisches Verständnis" zu deuten.
Bei der bisher skizzierten Überlegung gingen wir von dem Ladungsmuster aus, suchten Übereinstimmendes in denjenigen Tests zu erkennen, die mit diesem Faktor hoch geladen sind (Markiervariablen), bildeten eine Inter[422]pretationshypothese, prüften, ob diese mit den Nulladungen (Hyperebe-Invariablen) vereinbar ist, und charakterisierten den Faktor vorläufig durch he verbale Bezeichnung. Wir überlegten, ob die Interpretation des Fakirs mit der Ladungsverteilung in jeder Spalte vereinbar ist. Nunmehr üfen wir auf analoge Weise, ob die Faktoreninterpretation sich mit •r ze/'/enweisen Ladungsverteilung verträgt.
Wir fragen also zum Beispiel: Darf Faktor 3 als „sprachlogisches Verständnis"
gedeutet werden, wenn er die Variable 1 (Gemeinsamkeiten finden) höchsten
lädt und die beiden anderen Faktoren für diesen Test geringfügige
Ladungen aufweisen? Es gibt keinen zwingenden Grund, diese Deutung als
psychologisch unmöglich zu betrachten und daher aufzugeben.
Bezüglich des Tests 3 (Rechnerisches Denken)
sind alle drei Faktoren mäßig hoch geladen. Benötigt man
zur Lösung der hier verwendeten eingekleideten echenaufgaben gleicherweise
Fähigkeiten, die durch den Faktor 1 („schluß-Igerndes Denken"),
den Faktor 2 („verbale Kenntnisse") und durch den Iktor 3 („sprachlogisches
Verständnis") abgebildet werden? Es scheint lusibel, daß alle
drei Faktoren das Lösungsverhalten bei Test 3 beein-ssen. Folglich
halten wir an der Interpretationshypothese fest, ir haben die intuitive
Deutung der Faktoren so breit dargestellt, weil ise Etappe der Faktoreninterpretation
nie übersprungen werden kann, m anderen aber auch, um dem Leser mit
allem Nachdruck vor Augen zu Iren, wie vage und unpräzise die Überlegungen
sind, von denen man sich ten lassen kann. Die vorgeschlagenen Deutungen
sind zwar naheliegend, er keineswegs zwingend. Andere Untersucher können
mit gutem Recht d ähnlicher Plausibilität zu anderen Faktoreninterpretationen
kommen, ch wenn ihnen ein und dieselbe Faktormatrix vorliegt. Es gibt grundsätz-jh
viele, keineswegs deckungsgleiche Interpretationen
der Faktoren, 'eiche Deutung man wählt, das hängt
von theoretischen Bezugssystemen i, in denen der Untersucher zu denken
gewohnt ist, von seinem psycho-gischen Wissen, von der Sorgfalt, mit der
er die Anforderungen analysiert, ! jeder Aufgabentyp an den Probanden stellt,
nicht selten auch von den Wartungen, die er im Hinblick auf das Analyseergebnis
hegt. Subjektive «hflüsse sind bei der Interpretation der Ergebnisse
unvermeidlich, noch viel stärkerem Grade ist das der Fall, wenn der
Deutung zwar iden-che Ausgangsdaten und Korrelationsmatrizen, jedoch unterschiedliche
ktormatrizen zugrundeliegen, die durch verschiedene Analysetechniken )d
Drehungsverfahren zustandekamen. Dann unterscheiden sich die
Ladungsmuster der Faktoren bei verschiedenen Auswertern. Fast zwangsläufig
führt das auch zu Interpretationsunterschieden. Da aber - wie im ranstehenden
Text wiederholt betont wurde - unter mathematischen esichtspunkten grundsätzlich
eine unbegrenzte Zahl faktorenanalytischer sungen möglich ist und
die methodischen Konventionen zur Einschränkung ser Unbegrenztheit
unterschiedliches Vorgehen durchaus noch zulassen, [<423] darf man bei
der Interpretation verschiedener Analysen durch verschiedene Auswerter
keinesfalls identische Resultate erwarten. Die Anzahl der extrahierten
Faktoren, die Beträge der Faktorladungen und - davon abhängig
- die inhaltliche Bestimmung der Faktoren hängen von zahlreichen
Bedingungen ab, die nicht eindeutig vorgeschrieben werden können,
sondern vom Untersucher festgelegt werden müssen. Es wird niemanden
verwundern, wenn selbst solche Analysen, die sich dem gleichen Merkmalsbereich
an vergleichbaren Versuchspersonen widmen, trotz lege artis durchgeführter
Analyse zu Resultaten kommen können, die voneinander abweichen. Es
wäre falsch, dies zu verschweigen, zu beschönigen oder zu bagatellisieren.
Vielmehr müssen wir nach Wegen suchen, wie sich die durch Subjektivismen
bedingte Vieldeutigkeit interpretativer Analyseergebnisse einschränken
läßt. Eine wichtige Konsequenz: Die Interpretation der Faktoren
ist die anspruchsvollste Teilaufgabe der ganzen Analyse. Sie beansprucht
das fundierte Fachwissen des Forschers, seine Kenntnis der einschlägigen
Fachliteratur und ein hohes Maß an Methodenkritik und methodologischer
Wachsamkeit. Der Untersucher sollte versuchen, extrahierte Faktoren durch
Vergleich mit Ergebnissen anderer Analysen zu identifizieren.
Dieser Aufgabe wenden wir uns nun zu."
___
FN1 Diesen Abschnitt verfaßte
G. CLAUSS.
Harmann, H.H. (1970), p.153-155: Interpretation of principal factors.
"8. Interpretation of principal factors.—The coefficients of the first
factor in Table 8.12 are all large and positive, indicating an important
general factor of physical growth (G) among these variables. On the other
hand, the second factor has loadings of opposite signs for the two subgroups
of variables. From the nature of the variables, this bipolar factor might
be called "Stockiness." If desired, of course, the signs of all the coefficients
of this factor may be changed. Then this factor might be labeled "Lankiness."
Whatever name is selected for a bipolar factor,
its opposite characteristic should be clearly recognizable. A more fundamental
approach is to find a basic term which connotes the entire continuum. For
example, a bipolar factor which is named "Heat" (or, "Cold") would have
the opposite characteristic "Cold" (or, "Heat"). A name representing both
of these characteristics is "Temperature." These two approaches may be
indicated schematically as in Figure 8.1.
Inasmuch as "Stockiness" and "Lankiness" are not
clearly distinguishable as opposites (according to a of Fig. 8.1), neither
of these seems to be an appropriate [<153]
name for the bipolar factor. In an attempt to get a name, of the type
b, which transcends the specific descriptions of the variables, the term
"Body Type" {BT) has been adopted. On this continuum, variables describing
different body types have projections of opposite sign.
The diagram for these eight variables in the plane of the two principal
factors is presented in Figure 8.2, the coordinates coming from Table 8.12.
The two subgroups of variables lie in the first and fourth quadrants. Hence
the projections of all the points form a single cluster on the positive
end of the G axis. The projections on the BT
Lienert
Pawlik 1968
Revenstorf 1976
Überla 1971
Schermelleh-Engel, Karin & Werner, Christina S. (2012). 6
Methoden der Reliabilitätsbestimmung. In (120-141): Moosbrugger et
al. (2012).
Spearman, C. (1910). Correlation calculated with faulty data. British
Journal of Psychology, 3, 271-295. S. 134: "Faktorenanalytische Untersuchungen
haben gezeigt, dass invers formulierte Items einen eigenen Faktor bilden
können, unabhängig vom jeweiligen Iteminhalt (vgl. u. a. Podsakoff,
MacKenzie, Lee & Podsakoff, 2003; ein inhaltliches Beispiel findet
sich in Rauch, Schweizer & Moosbrugger, 2007)."
Suchen in der IP-GIPT,
z.B. mit Hilfe von "google": <suchbegriff>
site:www.sgipt.org
z.B. Wissenschaft site:www.sgipt.org. |
noch nicht end-korrigiert
[Intern: Entstehungsgeschichte: Die Seite wurde am 21.09.2012 angelegt
und bis 22.09.2012 bearbeitet. Am 29.12.2013 wieder damit auseinandergesetzt.]