Deutsch | English | ||||
Berechnung von Dendrogrammen
Clusteranalyse ist ein effizientes Werkzeug, um Zusammenhänge in multidimensionalen Datenräumen zu erkennen. Das folgende Beispiel findet Ähnlichkeiten von Mineralwässern, die durch ihre chemischen Analyseparameter charakterisiert worden sind. Nach dem Start der Clusteranalyse müssen zuerst die Variablen ausgewählt werden, die zur Beschreibung des Datenraums verwendet werden sollen:
DataLab berechnet nun das Dendrogramm anhand der aktuell eingestellten Parameter. Dazu gehören die Art der Dendrogrammberechnung ("Verfahren"), das verwendete Distanzmaß und die Skalierung der Daten.
Das berechnete Dendrogramm kann dazu benutzt werden, die Daten in Klassen einzuteilen. Dazu wird einfach eine Mindestdistanz vorgegeben (strichlierte rote Linie), die die einzelnen Cluster trennen soll. Klickt man an der gewünschten Position, so werden den Daten die entsprechenden Klassennummern zugeteilt. Das Dendrogramm erscheint darauf entsprechend eingefärbt.
|
|||||