DataLab ist ein kompaktes Statistikprogramm zur explorativen Datenanalyse. Weitere Informationen finden Sie auf den DataLab Webseiten ....



Format der ASC Dateien

DataLab benützt ein einfaches ASCII-Format, um Daten zu IMPORTIEREN und zu EXPORTIEREN. Diese Datendatei (Textdatei) hat folgende Struktur:

Zeile 1 Beliebige Kopfzeile, die maximal 255 Zeichen enthält. Beachten Sie, dass diese Kommentarzeile im Dialog zum Laden von ASC-Dateien von DataLab angezeigt wird.
Zeile 2  Parameter NFEAT: Anzahl an Spalten (Variablen, Merkmalen) der Datenmatrix (die optionalen Objektnamen und Klasseninformationen nicht eingeschlossen). Dieser Zahl kann ein beliebiger Kommentar folgen, solang er vom Zahlenwert durch zumindest ein Leerzeichen getrennt ist, und die Zeile nicht länger als 255 Zeichen ist.
Zeile 3 Parameter NOBJ: Anzahl an Objekten der Datenmatrix. Dieser Zahl kann ein beliebiger Kommentar folgen, solang er vom Zahlenwert durch zumindest ein Leerzeichen getrennt ist, und die Zeile nicht länger als 255 Zeichen ist.
Zeile 4 Parameter FLAG_CLASSINFO, FLAG_FEATNAMES, FLAG_OBJNAMES (mögliche Werte: 'WAHR' oder 'FALSCH'). Diese Parameter legen das Vorhandensein oder Nichtvorhandensein zusätzlicher Informationen wie Klasseninformationen (FLAG_CLASSINFO), Namen von Merkmalen (FLAG_FEATNAMES), oder Objektnamen (FLAG_OBJNAMES) fest. Falls einer dieser Parameter 'WAHR' ist, wird die spezielle Information in die folgende Datentabelle eingefügt. Das Format der Datentabelle wird entsprechend angepasst. Die Werte der Parameter müssen zumindest durch ein Leerzeichen getrennt sein. Diesen Parametern kann ein beliebiger Kommentar folgen.
Zeilen 5..k Namen der Merkmale: Folgende Zeile(n), die die Namen der Merkmale, ist (sind) nur vorhanden, wenn der Parameter 'FEATNAMES' auf 'WAHR' gesetzt ist. Die Bezeichner der Merkmale müssen zumindest durch ein Leerzeichen oder ein beliebiges ASCII-Zeichen unter 32 getrennt sein, und sie müssen in der selben Sequenz wie die Variablen gespeichert werden. Wenn ein Merkmalsbezeichner Leerzeichen enthält, muss er von doppelten Anführungszeichen (") eingerahmt sein. Ein einfaches Anführungszeichen kann eingefügt werden, in dem zwei doppelte Anführungszeichen ("") verwendet werden. Die Anzahl der Namen muss der Anzahl der Merkmale entsprechen. Merkmalsnamen können in jeder Zeilennummer gespeichert werden, und die Zeilen können beliebig lang sein. Beachten Sie, dass die maximale Länge eines Spaltenbezeichner 50 Zeichen ist.
Zeilen k+1..n Klasseninformation, Objektnamen und Daten: Die Datentabelle wird Zeile für Zeile gespeichert, beginnend mit der ersten Variablen der ersten Eingabe. Jeder Variablenzeile gehen wahlweise Klasseninformationen und Zeilenbezeichner (=Objektnamen) vor. Diese zusätzliche Information wird nur gespeichert, wenn der Parameter FLAG_CLASSINFO und/oder FLAG_OBJNAMES auf 'WAHR' gestellt ist. Falls ein Zeilenbezeichner Leerzeichen enthält, muss der Bezeichner von doppelten Anführungszeichen (") umgeben sein.

Zwischen den Werten einer Zeile ist jede Anzahl von "carriage returns" oder Leerzeichen erlaubt. Auf jeden Fall wird empfohlen, die Datentabelle so zu speichern, dass sie einfach gelesen und bearbeitet werden kann.

Die Werte können in jedem Format gespeichert werden (ganzzahlig, Gleitkomma, Exponentialschreibweise), und sie müssen zumindest durch ein Leerzeichen getrennt sein. Klasseninformation muss ganzzahlig sein, die Zeilenbezeichner werden als Strings interpretiert. Die Zeilen können jede Länge haben und dürfen keinen Kommentar enthalten.

Folgendes Beispiel zeigt eine ASCII Datendatei, die 10 Zeilen zu je drei Variablen enthält:

This is a sample file
3                 ;number of features
10                ;number of objects
TRUE TRUE TRUE    ;class info, feat.names, obj.names
                   F1      F2      "oil speed"
1   S23X4         3.380    2.20    -4
1   S24X4        15.900   -2.20    -4.033E-05
1   C24X3         3.607    1.20    2
2   "S12 early"  -3.305    2.20    -4
2   S12          35.340   -2.20    2.888E-05
1   SWINTER      13.670    1.20    22
2   "SPG MER 9"  -3.376    2.20    4
1   B1           25.375   -2.20    -1.113E+01
2   B2           -1.650    1.20    -0.1
2   B3            2.509    1.20    -10.0


Last Update: 2013-Nov-14