Partielle kleinste Quadrate (PLS)

 

Die Methode der partiellen kleinsten Quadrate (PLS) kombiniert Funktionen der Hauptkomponentenanalyse und der multiplen Regression. Zuerst wird eine Reihe von latenten Faktoren extrahiert, die so viel wie möglich von der Kovarianz zwischen den unabhängigen und abhängigen Variablen erklären. Dann prognostiziert eine Regression die Werte der abhängigen Variablen mit Hilfe der Zerlegung der unabhängigen Variablen.

Inhalt

Ziele

Es gibt zwei Hauptgründe für die Verwendung von PLS:

  • Prognose
    Die Methode der partiellen kleinsten Quadrate ist eine gängige Methode zum Erzeugen eines prädiktiven Modells, wenn es viele und stark kollineare Modelle gibt.
  • Datenreduktion
    Die PLS wird verwendet, um eine Reihe von stark korrelierten Variablen in eine Reihe von unabhängigen Variablen umzuwandeln.

Verarbeitungsvorgang

Analysedaten vorbereiten

Die Methode der partiellen kleinsten Quadrate kann für Variablen verwendet werden, die stark korrelieren. Da die PLS-Methode als Kombination der Hauptkomponentenanalyse (PCA) und der Multiplen Regression betrachtet wird, können die für die PCA verwendeten Daten mit der PLS-Methode bearbeitet werden.

Berechnungsmethoden auswählen

Singulärwertzerlegung (SVD) oder Wolds Iteration

Diese zwei Methoden kommen zu dem gleichen Ergebnis. Der Unterschied liegt darin, dass Wolds Iteration etwas schneller ist als die SVD. SIMPLS wird in einigen Aufsätzen als Methode genannt. SIMPLS stellt einfach eine alternative Bezeichnung für die SVD oder Wolds Iteration dar.

Kreuzvalidierung

Die Verifizierung des Anpassungsmodells ist ein wichtiger Schritt. Die Kreuzvalidierung ermöglicht es, die Performance des Modells zu bewerten. Origin verwendet die Leave-One-Out-Methode, um eine Kreuzvalidierung durchzuführen. In Origin werden die prognostizierte Summe der Fehlerquadrate (PRESS) und die Quadratwurzel des Mittelwerts verwendet, um die optimale Anzahl von Faktoren der Kreuzvalidierung herauszufinden.

Umgang mit fehlenden Werten

Wenn es fehlende Werte unter den unabhängigen/abhängigen Variablen gibt, wird der gesamte Fall (ganze Zeile) aus der Analyse ausgeschlossen.

Methode der partiellen kleinsten Quadraten durchführen

  • Wählen Sie Statistik: Multivariate Analyse: Partielle kleinste Quadrate.
    Oder
  • Geben Sie pls -d im Skriptfenster ein.

 

Themen, die in diesem Abschnitt behandelt werden: