Epina DataLab
Features
Help & Support
Application Examples
Overview
Linear Regression
Digitizing Curves
t-Test
Dendrograms
Multiple Regression Model
Research done with DataLab
Download
Data Repository
Release History
Latest Changes
Purchase

Berechnung von Dendrogrammen

Clusteranalyse ist ein effizientes Werkzeug, um Zusammenhänge in multidimensionalen Datenräumen zu erkennen. Das folgende Beispiel findet Ähnlichkeiten von Mineralwässern, die durch ihre chemischen Analyseparameter charakterisiert worden sind. Nach dem Start der Clusteranalyse müssen zuerst die Variablen ausgewählt werden, die zur Beschreibung des Datenraums verwendet werden sollen:

 

DataLab berechnet nun das Dendrogramm anhand der aktuell eingestellten Parameter. Dazu gehören die Art der Dendrogrammberechnung ("Verfahren"), das verwendete Distanzmaß und die Skalierung der Daten.

 

Das berechnete Dendrogramm kann dazu benutzt werden, die Daten in Klassen einzuteilen. Dazu wird einfach eine Mindestdistanz vorgegeben (strichlierte rote Linie), die die einzelnen Cluster trennen soll. Klickt man an der gewünschten Position, so werden den Daten die entsprechenden Klassennummern zugeteilt. Das Dendrogramm erscheint darauf entsprechend eingefärbt.