2-4 Abalone Dataset

[english][all]

(請注意:中文版本並未隨英文版本同步更新!)

Abalone 資料集包含不同年齡之鮑魚的各項資料,特性如下:

我們可以計算每一個類別的資料量,如下:

Example 1: abaloneClassDataCount01.mDS=prData('abalone'); [classSize, classLabel]=dsClassSize(DS, 1); 8 features 4177 instances 28 classes

我們可以計算每一個類別的特徵分布圖,如下:

Example 2: abaloneClassDist01.mDS=prData('abalone'); index=DS.output>8; DS.input(:, index)=[]; DS.output(:, index)=[]; dsDistPlot(DS);

(In order not to clotter the plot, we have only shown the distributions among the first 8 classes.)

我們可以進行類別對單一特徵的作圖,如下:

Example 3: abaloneProjPlot1.mDS = prData('abalone'); dsProjPlot1(DS);

我們也可以將資料投影到二度空間,來觀察資料的分佈,範例如下:

Example 5: abaloneProjPlot2.mDS = prData('abalone'); opt.showAxisLabel=0; opt.showAxisTick=0; opt.showClassName=1; dsProjPlot2(DS, opt);

我們也可以將資料投影到三度空間,來觀察資料的分佈,但是會畫出的圖形將有 C(8, 3) = 56 個圖,如下:

Example 6: abaloneProjPlot3.mDS = prData('abalone'); opt.showAxisLabel=0; opt.showAxisTick=0; opt.showClassName=1; dsProjPlot3(DS, opt);

由於類別太多,所以無論是二度空間投影或是三度空間投影,都很難看出來是否有「同類資料分佈相近」的趨勢。


Data Clustering and Pattern Recognition (資料分群與樣式辨認)