Ergebnisse der Hauptkomponentenanalyse interpretieren

 

Inhalt

Berichtsblatt der Hauptkomponentenanalyse

Deskriptive Statistik

Die Tabelle der deskriptiven Statistik kann angeben, ob Variablen über fehlende Werte verfügen, und offenbart, wie viele Fälle tatsächlich in den Hauptkomponenten verwendet werden.

Wenn es nur ein paar fehlende Werte für eine einzelne Variable gibt, ist es häufig sinnvoll, eine gesamte Datenzeile zu löschen. Dies wird als listenweises Ausschließen bezeichnet. Wenn es fehlende Werte für zwei und mehr Variablen gibt, ist es im Allgemeinen empfehlenswert, die Methode des paarweisen Ausschlusses zu verwenden.

Die Prüfung von Mittelwerten und Standardabweichungen kann univariate/variate Differenzen zwischen Gruppen aufdecken. Sie sollten beachten, wenn Mittelwerte und Standardabweichungen sich sehr voneinander unterscheiden, da dies ein Hinweis darauf sein kann, dass Variablen auf verschiedenen Skalen gemessen werden. In diesem Fall verwenden wir dieKorrelationsmatrix für die Analyse.

Korrelationsmatrix

Diese Tabelle zeigt die Verhältnisse zwischen Variablen. Die Hauptkomponentenanalyse (PCA) zielt darauf ab, eine kleine Sammlung von unabhängigen Hauptkomponenten aus einer umfangreicheren Reihe von verwandten ursprünglichen Variablen zu erstellen. Im Allgemeinen sind höhere Werte nützlicher. Sie sollten in Betracht ziehen, niedrige Werte aus der Analyse auszuschließen.

Eigenwerte der Korrelations-/Kovarianzmatrix

Eigenwert Eigenwerte der Korrelations-/Kovarianzmatrix Dies stellt eine Aufteilung der gesamten Variation dar, jede Hauptkomponente berücksichtigend.
Anteil Der Anteil der Varianz erklärt durch jeden Eigenwert.
Kumulativ Der kumulative Anteil der Varianz bedingt durch die aktuellen und alle vorhergehenden Hauptkomponenten Wenn die i-te Komponente 90% der ürsprünglichen Informationen bewahrt, wird normalerweise empfohlen, i-Komopnenten zu behalten.
Hinweis: Wenn die Option Kovarianzmatrix unter Analysieren ausgewählt wird, wird das Ergebnis von Bartletts Test, der verwendet wird, um zu testen, ob die Eigenwerte der Hauptkomponenten gleich sind, in den zusätzlichen drei Spalten der Tabelle gezeigt.

Extrahierte Eigenvektoren

Die Hauptkomponentenvariablen werden als lineare Kombinationen der ursprünglichen Variablen X1,...,Xk,...,Xm definiert. Die Tabelle Extrahierte Eigenwerte enthält Koeffizienten für die Gleichungen unten.

Yk = Ck1X1 + Ck2X2 + ... + CkmXm (1)


wobei

  • Yk die k-te Hauptkomponente k ist
  • C's die Koeefizienten in der Tabelle sind

Scree-Diagramm

Das Scree-Diagramm ist eine nützliche visuelle Hilfe, um eine angemessene Anzahl von Hauptkomponenten zu bestimmen. Der Screeplot zeichnet den Eigenwert gegen die Komponentenanzahl. Um die geeignete Anzahl von Komponenten zu bestimmen, suchen wir einem bestimmten Punkt in dem Scree-Diagramm. Die Anzahl der Komponenten richtet sich nach diesem Punkt, an dem die verbleibenden Eigenwerte relativ klein und ungefähr alle gleich groß sind.

Ladungsdiagramm

Das Ladungsdiagramm ist eine Zeichnung der Beziehung zwischen den ursprünglichen Variablen und den Unterraumdimensionen. Es wird verwendet, um Beziehungen zwischen Variablen zu interpretieren.

Scores-Diagramm

Das Score-Diagramm ist eine Projektion von Daten auf den Unterraum. Es wird zum Interpretieren von Beziehungen zwischen den Beobachtungen verwendet.

Biplot

Der Biplot zeigt beides, die Ladungen und die Scores für zwei ausgewählte Komponenten, parallel.

Score-Daten

Das Arbeitsblatt bietet die Scores der Hauptkomponeneten für jede Variable.