Partial-Least-Square
Die Methode der partiellen kleinsten Quadrate (PLS) kombiniert Funktionen der Hauptkomponentenanalyse und der multiplen Regression. Zuerst wird eine Reihe von latenten Faktoren extrahiert, die so viel wie möglich von der Kovarianz zwischen den unabhängigen und abhängigen Variablen erklären. Dann prognostiziert eine Regression die Werte der abhängigen Variablen mit Hilfe der Zerlegung der unabhängigen Variablen.
Es gibt zwei Hauptgründe für die Verwendung von PLS:
Die Methode der partiellen kleinsten Quadrate kann für Variablen verwendet werden, die stark korrelieren. Da die PLS-Methode als Kombination der Hauptkomponentenanalyse (PCA) und der Multiplen Regression betrachtet wird, können die für die PCA verwendeten Daten mit der PLS-Methode bearbeitet werden.
Diese zwei Methoden kommen zu dem gleichen Ergebnis. Der Unterschied liegt darin, dass Wolds Iteration etwas schneller ist als die SVD. SIMPLS wird in einigen Aufsätzen als Methode genannt. SIMPLS stellt einfach eine alternative Bezeichnung für die SVD oder Wolds Iteration dar.
Die Verifizierung des Anpassungsmodells ist ein wichtiger Schritt. Die Kreuzvalidierung ermöglicht es, die Performance des Modells zu bewerten. Origin verwendet die Leave-One-Out-Methode, um eine Kreuzvalidierung durchzuführen. In Origin werden die prognostizierte Summe der Fehlerquadrate (PRESS) und die Quadratwurzel des Mittelwerts verwendet, um die optimale Anzahl von Faktoren der Kreuzvalidierung herauszufinden.
Wenn es fehlende Werte unter den unabhängigen/abhängigen Variablen gibt, wird der gesamte Fall (ganze Zeile) aus der Analyse ausgeschlossen.
Themen, die in diesem Abschnitt behandelt werden: