Der Dialog der K-Means-Clusteranalyse

 

Variablen

Variablen Wählen Sie die Daten für die K-Means-Clusteranalyse. Die Daten in jeder Spalte entsprechen einer Variablen und jede Zeile einer Beobachtung.
Beobachtungsbeschriftungen Wählen Sie eine Spalte zum Beschriften von jeder Beobachtung (optional).

Optionen

Legt die Einstellungen für die K-Means-Clusteranalyse fest.

Variablen standardisieren
  • Kein
Variablen werden nicht standardisiert.
  • Z-Score (Auf N (0,1) standardisieren)
Variablen werden mit einem Mittelwert bei 0 und einer einheitlichen Standardabweichung standardisiert.
  • Auf (0,1) normieren
Variablen werden in dem Bereich zwischen 0 und 1 standardisiert.

Hinweis: Wenn Sie sich dafür entscheiden, Variablen zu standardisieren, werden Clusterzentren und Distanz aus den normalisierten Daten berechnet. Die deskriptive Statistik und ANOVA werden aber auf Grundlage der ursprünglichen Daten berechnet.

Anzahl der Cluster Legen Sie die Anzahl der Cluster fest. Diese Option wird nur aktiviert, wenn Anfängliche Clusterzentren festlegen nicht aktiviert ist. Der Wert sollte größer als 0 sein und nicht kleiner als die Anzahl der effektiven Beobachtungen.
Anfängliche Clusterzentren festlegen Bestimmt, ob anfängliche Clusterzentren festgelegt oder Standardanfangswerte verwendet werden sollen. Wenn Anfängliche Clusterzentren festlegen ausgewählt ist, wird die Option Anfängliche Clusterzentren verfügbar, so dass Daten aus einem Blatt als anfängliche Clusterzentren ausgewählt werden können.

Um mehr über die standardmäßigen anfänglichen Clusterzentren zu erfahren, lesen Sie bitte den Abschnitt zum Algorithmus für anfängliche Clusterzentren aus Beobachtungen.

Anfängliche Clusterzentren Legt die anfänglichen Clusterzentren aus Daten in einem Blatt fest. Diese Option ist nur verfügbar, wenn Anfängliche Clusterzentren festlegen aktiviert ist. Die Anzahl der Cluster ist die Anzahl der effektiven Zeilen die unter Anfängliche Clusterzentren ausgewählt wurden. Die Daten, die unter Anfängliche Clusterzentren ausgewählt sind, sollten die gleiche Anzahl von Variablen enthalten wie unter Variablen.
Maximale Anzahl von Iterationen Legt die maximale Anzahl der Iterationen fest, die in der Analyse erlaubt sind. Der Standardwert ist 10.

Eigenschaften

Legt die Mengen fest, die für die K-Means-Clusteranalyse berechnet werden sollen.

Anfängliche Clusterzentren Legt fest, ob die anfänglichen Clusterzentren in dem Bericht ausgeführt werden sollen.
ANOVA Legt fest, ob die ANOVA für das Clusterergebnis durchgeführt werden soll.
Clusterzugehörigkeit Legt fest, ob die Clusterzugehörigkeit in einem Blatt ausgegeben werden soll.
Distanz zu Clustern Legt fest, ob die Distanz zwischen jeder Beobachtung und dem Zentrum des zugewiesenen Clusters berechnet werden soll.

Zeichnung

Legt fest, ob das Gruppendiagramm gezeigt werden soll.

Clusterdiagramm Erstellen Sie das Clusterdiagramm mit X-Bereich = Hauptkomponente 1 (HK 1) und Y-Bereich = Hauptkomponente 2 (HK 2).

Wenn das Kontrollkästchen aktiviert ist, werden die Eigenschaften HK 1, HK 2, Beobachtungsbeschriftung (optional) und Zugehörigkeit außerdem in das Datenblatt K-Means-Clusterdiagramm ausgegeben. Das sich ergebende Clusterdiagramm hat dann (Details Zeichnung > Registerkarte Zentroid (Pro)) Zentroid für Teildatensatz zeigen, Mit Datenpunkten verbinden und Ellipse zeigen aktiviert.

Zusätzliches Gruppendiagramm Legt fest, ob das Gruppendiagramm dort gezeigt werden soll, wo Beobachtungen durch die Clusterzugehörigkeit gruppiert sind. Wenn diese Option aktiviert ist, wird der Zweig Variablen für Diagramm auswählen angezeigt.
Variablen für Diagramm auswählen Wählen Sie die Variablen als x und y für das Gruppendiagramm.
  • X-Bereich
Wählen Sie aus dem Blatt die Variable als X-Achse für das Gruppendiagramm.
  • Y-Bereich
Wählen Sie aus dem Blatt die Variable als Y-Achse für das Gruppendiagramm.

Beachten Sie, dass Variablen im Gruppendiagramm sich von denen für die K-Means-Clusteranalyse unterscheiden.

Ausgabeeinstellungen

Legt das Ziel der Ausgabeergebnisse für die K-Means-Clusteranalyse fest.

K-Means-Bericht Legt das Blatt für den Bericht der K-Means-Clusteranalyse fest. Der Standardwert ist ein neues Blatt in der Arbeitsmappe der Eingabedaten.
Clusterzugehörigkeit Legt das Blatt für die Clusterzugehörigkeit und Distanz zum Cluster fest. Der Standardwert ist ein neues Blatt in der Arbeitsmappe der Eingabedaten. Beachten Sie, dass diese Option deaktiviert ist, wenn weder Clusterzugehörigkeit noch Distanz zum Cluster in der Gruppe Eigenschaften deaktiviert ist.

Neu berechnen

Legen Sie fest, wie das Ergebnis neu berechnet und aktualisiert wird, wenn sich die Eingangsdaten oder Einstellungen ändern.

Kein Die Ausgabe wird nicht mit den Quelldaten verbunden, und Änderungen an den Quelldaten führen zu keiner Aktualisierung des Ergebnisses. Ergebnisse werden nicht neu berechnet, wenn die Einstellungen geändert werden.
Auto Das Ergebnis aktualisiert sich automatisch, wenn sich die Quelldaten ändern. Sie können auch die Einstellungen ändern, um das Ergebnis neu zu berechnen.
Manuell Das Ergebnis wird nicht automatisch aktualisiert, wenn sich die Quelldaten ändern. Sie müssen die Aktualisierung manuell durchführen, indem Sie auf die Schaltfläche Neu berechnen Button Recalculate Manual.png auf der Symbolleiste Standard klicken. Sie können auch die Einstellungen ändern, um das Ergebnis neu zu berechnen.