DataLab ist ein kompaktes Statistikprogramm zur explorativen Datenanalyse. Weitere Informationen finden Sie auf den DataLab Webseiten ....



Farbkarte

Befehl: Visualisierung -> Farbkarte

DataLab ermöglicht es, aus drei Variablen eine farbkodierte Karte zu erzeugen. Dabei werden zwei Variablen als Achsen des Diagramms verwendet, aus der dritten Variablen wird eine Farbfläche erzeugt. Die erzeugten Karten ähneln geographischen Karten mit farbkodierten Höhenschichtlinien. Um für beliebige Daten eine vollständige Farbkarte erzeugen zu können werden Bereiche, wo keine Daten vorliegen, aus den benachbarten Daten extrapoliert. Die Berechnung der Farbkarte benötigt je nach Auflösung einige Sekunden und muss vom Benutzer durch Klicken des Knopfes Berechnen explizit gestartet werden.

Die Variablen werden ausgewählt in dem man auf die entsprechenden Variablen-Knöpfe klickt. Möchte man zusätzlich die zugrundeliegenden Daten einblenden, so muss die Auswahlbox "Daten anzeigen" aktiviert werden. Die Farben der Farbkarte können beliebig eingestellt werden, in dem man für drei Stützpunkte (niedrig, mittel, hoch) die entsprechenden Farben definiert. Neben den zwei Grundeinstellungen "Standardfarben" und "Graustufenskala", können zuvor gespeicherte Farbzuordnungen von der Harddisk geladen werden (Files *.cpc im DataLab-Arbeitsverzeichnis). Außerdem kann die Farbskala wahlweise auf den gesamten Wertebereich (Min/Max) oder auf den Interquartilbereich eingestellt werden. In den meisten Fällen wird man "Min/Max" verwenden, nur für die Hervorhebung des mittleren Wertebereichs der Z-Achse wird man den Interquartilbereich einsetzen.

Die Art der Interpolation der Werte der Farbkarte kann durch die Auswahlbox "Gewichtung" eingestellt werden. Die Option "Gauß'sche Kurve" verwendet zur Interpolation die mit Hilfe von Gaussfunktionen gewichtete Summe der Werte der k nächsten Nachbarn. Die Gewichte hängen von der Breite der Gaussfunktionen ab, die durch den Parameter "Glättung" eingestellt werden kann. Ist Glättung zu klein eingestellt (Werte unter 1.0), so werden alle k Nachbarn zur Berechnung des Gesamtbetrages herangezogen, was einen stufigen Verlauf der interpolierten Kurve erzeugt. Bei zu großem Wert für die Glättung (oberhalb von 2.5) wird jeweils nur der nächste Nachbar verwendet, was ebenfalls zu stufigem Verlauf führt. Einen guten Kompromiss stellt ein Wert von 1.3 bis etwa 1.7 dar. Bei der Option "Durchschnitt" wird als interpolierter Wert der Durchschnitt der k nächsten Nachbarn herangezogen. Die Option "Median" setzt für den interpolierten Wert den Median der k nächsten Nachbarn ein. Diese Option wird man für Klassifikatoren verwenden, während die Option "Gauß'sche Kurve" für die Abschätzung glatter Response-Kurven am besten geeignet ist.

Der Parameter "Auflösung" bestimmt die Zahl der Interpolationspunkte pro Achse für die Berechnung der Farbkarte. Je höher dieser Wert, desto feiner wird die Karte. Die Rechendauer nimmt allerdings mit dem Quadrat dieses Wertes zu.

Der Parameter "# Nachbarn" bestimmt die Zahl der nächsten Nachbarn, die zur Abschätzung der Z-Werte herangezogen wird. Je höher dieser Wert, desto verwaschener wird die Farbkarte. Bei zu niedrigem Wert wird die Interpolation stufig. Ein Wert von 5 nächsten Nachbarn stellt einen guten Kompromiss dar.

Bewegt man die Maus in der Farbkarte, so werden die Koordinaten der jeweiligen Mausposition in den Variablen-Auswahlknöpfen angezeigt. Für den Z-Wert wird dabei der jeweilige Wert der Karte angezeigt (und nicht der Wert des jeweils nächsten Nachbarn).


Last Update: 2012-Jul-25