DataLab ist ein kompaktes Statistikprogramm zur explorativen Datenanalyse. Weitere Informationen finden Sie auf den DataLab Webseiten ....



RBF Netzwerk - wachsendes Netzwerk

Befehl: Mathematik -> Neuronales Netzwerk -> RBF Netzwerk -> Wachsendes Netzwerk

Der Befehl Growing Network bietet eine Methode zur Auswahl von Merkmalen, die in früheren Werken [Lohninger 93d] als 'wachsende neuronale Netzwerke' bezeichnet wurden: Das neuronale Netzwerk wächst in seiner Eingabeschicht während der Wahl der Merkmale. Die Methode beginnt mit einer neuronalen Netzwerkarchitektur, die nur ein Eingabeneuron besitzt. Dann wird eine Variable nach der anderen ausgewählt, und das Netzwerk wird unter Benützung der Variablen trainiert und evaluiert. Die Variable, die die besten Ergebnisse liefert, wird gespeichert und an das erste Neuron der Eingabeschicht angehängt, nachdem alle Merkmale verarbeitet wurden. Nach diesem Schritt wächst das Netzwerk in seiner Eingabeschicht um ein Neuron, und der Selektionsvorgang wird in der selben Weise wie oben beschrieben wiederholt. Dadurch werden die besten Merkmale der vorherigen Läufe mit einem neuen Merkmal kombiniert, was in der größten Steigerung des Bestimmtheitsmaßes resultiert. Um die mehrfache Auswahl eines Merkmales zu unterbinden, werden die Merkmale für den Rest des Selektionsprozesses ausgeschlossen, die schon gewählt wurden.

Zusätzlich kann der Benutzer interaktiv die erste Variable festlegen, und damit die automatische Wahl des ersten Merkmals überspringen. Das kann in Situationen nützlich sein, wo ein einzelnes Merkmal beim Schätzen der Trainingsdaten eine bessere Ausführung liefert als alle anderen, aber versagt, wenn es mit anderen Variablen kombiniert wird.

Nachdem Sie Growing Network angeklickt haben, müssen Sie die zu modellierende Variable angeben. Alle anderen Variablen werden als potentielle Eingabevariablen betrachtet. Während des Erstellens der Eingabeschicht werden die kürzlich ausgewählten Eingabevariablen als invertierte Fläche im Überblicksfenster dargestellt. Das gibt einen guten Überblick über die bis jetzt ausgewählten Variablen. Die beste Variablenkombination wird in einem Fenster auf der rechten Seite des Bildschirmes angezeigt. Diese Liste gibt die Anzahl an Variablen, die Standardabweichung der Residuen und das Bestimmtheitsmaß an, das bis jetzt erreicht wurde.

Hinweis: Die optimale Zahl an Variablen wird durch die Problemstellung gegeben. Meistens steigen die Ergebnisse der Trainingsläufe (Bestimmtheitsmaß) bis zu einem maximalen Punkt, und beginnen dann wieder zu fallen. Die Variablenkombination rund um diesen Punkt sind ein guter Hinweis auf die beste Kombination. Dennoch wird nur eine Kreuzvalidierung die beste Kombination sichtbar machen.


Last Update: 2012-Jul-25