2D-Kernel-Dichte

 

Das 2D-Kernel-Dichtediagramm ist eine geglättete Darstellung der Farbdichte des Punktdiagramms, basierend auf der Kernel-Schätzung, eine nichtparametrische Methode für Wahrscheinlichkeitsfunktionen. Das Ziel der Dichteschätzung besteht darin, eine endliche Stichprobe von Daten zu nehmen und die zugrundeliegende Wahrscheinlichkeitsdichtefunktionen überall abzuleiten, einschließlich dort, wo kein Datenpunkt dargestellt wird. In Kernel-Dichte-Schätzungen wird der Beitrag jedes Datenpunkts von einem einzelnen Punkt aus in den angrenzenden Bereich geglättet. Diese geglätteten Dichtediagramme zeigen einen Durchschnittstrend für das Punktdiagramm.

2D-Kernel-Dichtediagramm erstellen

Um ein 2D-Kernel-Dichtediagramm zu erstellen

  1. Markieren Sie eine Y-Spalte.
  2. Öffnen Sie den Dialog des 2D-Kernel-Dichtediagramms, indem Sie auf Zeichnen: Kontur: 2D-Kernel-Dichte klicken.
  3. Legen Sie im Dialog plot_kde2 Methode, Anzahl der Gitternetzpunkte in X/Y und Anzahl der anzuzeigenden Punkte sowie den Diagrammtyp fest.
  4. Klicken Sie auf OK, um ein 2D-Kernel-Dichtediagramm zu erstellen.
    2D-Kernel.png

Der Dialog plot_kde2

2D Kernel Density dialog.png

Eingabedaten

Legen Sie den Eingabedatenbereich fest.

Einstellungen

Bandbreitenmethode
Legen Sie die Bandbreitenberechnungsmethode des 2D-Kernel-Dichtediagramms fest.
  • Bivariater Kerndichteschätzer
  • Daumenregel
Dichtemethode
Legen Sie eine Methode zum Berechnen der Kerneldichte für definierte XY-Gitternetze fest.
  • Genaue Schätzung
Wählen Sie die Option zum Berechnen der Dichtewerte gemäß der Gleichung Ks2density. Bei einem großen Datensatz kann die Berechnung der genauen Schätzung aus sehr umfassend ausfallen.
  • Eingeteilte approximative Schätzung
Wählen Sie die Option zum Berechnen der Approximation der Dichtewerte. Diese Option wird für eine große Stichprobe empfohlen.
Anzahl der anzuzeigenden Punkte
Legen Sie die ersten N niedrigsten Dichtepunkte fest, die im Dichtebild eingeblendet werden sollen.
Dichtepunkte interpolieren
Legen Sie die Berechnungsmethode fest, um zu entscheiden, welche Punkte im Dichtebild eingeblendet werden sollen (siehe Einzelheiten im Abschnitt Algorithmus unten). Üblicherweise empfehlen wird, wenn die Anzahl der Quelldaten groß ist (d. h. > 50000) die Verwendung dieser Option, um die Geschwindigkeit zu verbessern.
Anzahl der Gitternetzpunkte in X/Y
Legen Sie die Anzahl der äquidistant verteilten Gitternetzpunkte für die Dichteschätzung fest.
Anzahl der anzuzeigenden Punkte
Legen Sie die ersten N niedrigsten Dichtepunkte fest, die im Dichtebild eingeblendet werden sollen, wenn das Kontrollkästchen Alle deaktiviert ist. Standardmäßig ist das Kontrollkästchen Alle aktiviert, und es werden alle Punkte angezeigt.
Gitternetzbereich
In einem Zwischenschritt wird eine Matrix der Gridding-Werte aus den XY-Daten erzeugt und das Kernel-Dichte-Diagramm aus den Matrixwerten erstellt. Standardmäßig registriert der Gitternetzbereich die minimalen und maximalen X- und Y-Werte in dieser Matrix. Deaktivieren Sie das Kontrollkästchen Auto, um einen Wert manuell einzugeben.
  • X-Minimum
  • X-Maximum
  • Y-Minimum
  • Y-Maximum
Diagrammtyp
Legen Sie den Diagrammtyp fest.
  • Kontur
Verwenden Sie die Dichtematrix, um die Kontur zu zeichnen.
  • Bild
Verwenden Sie die Dichtematrix, um ein Bilddiagramm zu erstellen.

Daten der Dichteschätzung

Diese Option bestimmt, wo die für das Diagramm berechneten Daten gespeichert werden.

Daten anzeigen

Diese Option bestimmt, wo die Daten des angezeigten Punktdiagramms gespeichert werden. Sie ist nur verfügbar, wenn Anzahl der anzuzeigenden Punkte nicht 0 ist.

Algorithmus

Die Kerneldichteschätzung ist eine nichtparametrische Methode zum Schätzen der Dichte von Streupunkten. Das Ziel der Dichteschätzung besteht darin, die zugrundeliegende Wahrscheinlichkeitsdichtefunktion überall in den vorhandenen Streupunkten zu schätzen, einschließlich dort, wo kein Daten beobachtet werden. Eine Kernel-Funktion wird mit dem Bezugswert in ihrer Mitte erstellt – dies stellt sicher, dass der Kernel symmetrisch zum Bezugswert ist. Die Schätzung der Kernel-Dichte glättet den Beitrag der Datenpunkte, um ein Gesamtbild der Dichte der Datenpunkte zu liefern.

Density grids.png

Berechnungsmethode der Dichte

Legen Sie eine Methode zum Berechnen der Kerneldichte für definierte XY-Gitternetze fest.

Genaue Schätzung

Die Dichtewerte werden basierend auf der untenstehenden Gleichung berechnet.

f(x,y,\text{vX},\text{vY},w_x,w_y) = \frac{1}{n} \sum_{i=1}^{n} \frac{1}{ 2\pi w_x w_y } \exp \left(-\frac{(x-\text{vX}_i)^2}{2w_x ^2} - \frac{(y-\text{vY}_i)^2}{2w_y^2} \right)

wobei n die Anzahl der Elemente in Vektor vX oder vY, \text{vX}_i das i-te Element in Vector vX und \text{vY}_i das i-te Element in Vektor vY ist. w_x und w_y sind die optimalen Bandbreitenwerte.

Eingeteilte approximative Schätzung

Beschleunigen Sie die Dichteberechnung durch eine Approximation an die genaue Schätzung der 2D-Kernel-Dichte.

Zuerst wird eine 2D-Einteilung für die (X-, Y-) Punkte durchgeführt, um eine Matrix mit den Klassenanzahlen zu erhalten. Dann wird die 2D-Fast-Fourier-Transformation verwendet, um diskrete Faltungen zum Berechnen der Dichtewerte von jedem Gitternetz durchzuführen.

Die 4. Wurzel der Dichtewerte wird berechnet, um die Dichteskala auf die Farbskala abzubilden.

Bandbreitenmethode

Bivariater Kerndichteschätzer

Berechnen Sie die Bandbreite basierend auf einem linearen Diffusionsprozess.

Daumenregel

Die Schätzung von wx und wy kann einfach mit Folgendem berechnet werden:

w_x = \frac{\sigma_x}{2n^{1/6}}
w_y = \frac{\sigma_y}{2n^{1/6}}

wobei n die Größe des Vektors vX oder vY, \sigma_x die Standardstreuung der Stichprobe für den Datensatz vX und \sigma_y diese entsprechend für den Datensatz vY ist.

 

Dichtepunkte interpolieren

Legen Sie die Berechnungsmethode fest, um zu entscheiden, welche Punkte im Dichtebild eingeblendet werden sollen.

Wenn die Option ausgewählt ist, wird die Kernel-Dichte der Punkte durch die Interpolation der Dichtematrix für definierte XY-Gitternetze berechnet. Wenn die Anzahl der Quelldaten sehr groß ist, kann die Verwendung dieser Option die Geschwindigkeit enorm verbessern.

Sollte die Option nicht ausgewählt sein, werden die Dichtewerte mit der Methode der genauen Schätzung berechnet.