DataLab ist ein kompaktes Statistikprogramm zur explorativen Datenanalyse. Weitere Informationen finden Sie auf den DataLab Webseiten ....



Einfache Regression

Befehl: Mathematik -> Einfache Regression...

Der Befehl Mathematik/Einfache Regression... ermöglicht es, die Regression zwischen einer einzelnen Eingangsvariablen und einer abhängigen Variablen zu berechnen. Folgende Regressionskurven stehen zur Verfügung(1):
Gerade y = kx + d Parabel y = a + bx + cx2
reziproke Kurve y = 1/(a + bx) hyperbolische Kurve y = a + b/x
logarithmische Kurve y = a + bln(x) exponentielle Kurve y = a ebx
polynomische Kurve (j=2..10) y = a0 + Sajxj     zentriertes Polynom (j=2..10) y = a0 + Saj(x-x0)j
Hoerl-Funktion y = k0k1xxk2 Normalverteilung
Natürliches Spline y = Sk(x) = ak,0 + ak,1(x-xk) +
ak,2(x-xk)2 + ak,3(x-xk)3
für x [xk, xk+1] und k=0,1,2...n-1
Geglättetes Spline y = Sk(x) = ak,0 + ak,1(x-xk) +
ak,2(x-xk)2 + ak,3(x-xk)3
für x [xk, xk+1] und k=0,1,2...n-1
Glättungsfaktor γ = 0.0...1.0

Hinweis: Wenn man eine Polynomial-Anpassung von Daten mit einem kleinen Bereich aber einem großen Offset durchführt, kann es zu Problemen aufgrund von numerischen Instabilitäten und Rundungsfehlern kommen (das ist kein Versagen von DataLab sondern ein allgemeines Problem der begrenzten Genauigkeit von Digitalrechnern). Ein möglicher Ausweg ist die Benützung zentrierter Polynome, bei denen man den Offset x0 auf den Mittelwert der x-Werte setzt (DataLab macht dies automatisch wenn man den Knopf "Zentr. Polynom" drückt).

Nachdem Sie den Befehl angeklickt haben, müssen Sie zuerst die Eingangsvariable und dann die abhängige Variable auswählen. Danach wird ein Fenster geöffnet, in welchem Sie einen der oben angeführten Kurventypen wählen und die entsprechenden Parameter berechnen können.

Die Reiter "Regression", "Residuen", "Verteilung der Residuen", "Details", und "Berechnen" erlauben, es die verschiedenen Aspekte der Regressionsanalyse zu betrachten und das erzeugte Modell zur Abschätzung unbekannter Werte einzusetzen.

Regression Auf dieser Seite werden die Daten und die Regressionskurve dargestellt. Daten können durch Zeichnen eines Rechtecks markiert werden.
Residuen Die Residuen aufgetragen gegen die unabhängige Variable. Hier können ebenfalls die Daten durch Zeichnen eines Rechtecks markiert werden.
Verteilung der Residuen Diese Seite zeigt das Histigramm der Residuen, das durch die ideale Normalverteilung überlagert ist.
Details Hier werden die wichtigsten Details zur ausgewählten Regressionsfunktion gezeigt: Die Parameter der Kurve, der Durbin-Watson-Test auf serielle Korrelation der Residuen, der Lilliefors-Test auf Normalverteilung der Residuen und die ANOVA-Tabelle.
Berechnen Auf dieser Seite kann man die Werte des abhängigen Variablen für bestimmte Werte der unabhängigen Variablen schätzen. Das Konfidenzintervall wird sowohl für den Mittelwert als auch für Einzelwerte berechnet (auf einem Konfidenzniveau, das vom Benutzer vorgegeben werden kann).

Links neben dem Diagrammfenster gibt es Schnellstartknöpfe, die folgende Aktivitäten unterstützen:

Umschalten der Achsen Die aktuell ausgewählte Variable kann durch Klicken der Pfeil tasten geändert werden. Die oberen Knöpfe beziehen sich auf die abhängige Variable, die unteren auf die unabhängige.
Neue Variablen auswählen Klickt man den Knopf, so kann man eine andere Variable mit Hilfe des Variablenauswahldialogs auswählen.
Markierungen entfernen Mit diesem knopf können alle Markierungen rückgängig gemacht werden.
Residuen kopieren Durch Klicken auf diesen Knopf werden die Residuen in das Matrix-Clipboard kopiert.
Regressionsgleichung speichern Die Regressionsgleichung kann als Scriptfile abgespeichert werden. Bitte beachten Sie, dass die Zielvariable noch definiert ist und durch den Platzhalter "CX$$" ersetzt ist.



(1) In der Evaluierungsversion stehen nicht alle Funktionen zur Verfügung.

Korrelation und Regression - über null Korrelation trotz starker Zusammenhänge.


Last Update: 2012-Dez-18