[english][all](請注意:中文版本並未隨英文版本同步更新!)
Abalone 資料集包含不同年齡之鮑魚的各項資料,特性如下:
- 資料筆數:共 4177 筆
- 特徵:共 8 種,都是鮑魚的量測數值,沒有未知量:
- Sex
- Length
- Diameter
- Height
- Whole weight
- Shucked weight
- Viscera weight
- Shell weight
- 類別:共 28 類,分別代表年齡從1歲到28歲的鮑魚。
我們可以計算每一個類別的資料量,如下:
我們可以計算每一個類別的特徵分布圖,如下:
(In order not to clotter the plot, we have only shown the distributions among the first 8 classes.)
我們可以進行類別對單一特徵的作圖,如下:
我們也可以將資料投影到二度空間,來觀察資料的分佈,範例如下:
我們也可以將資料投影到三度空間,來觀察資料的分佈,但是會畫出的圖形將有 C(8, 3) = 56 個圖,如下:
由於類別太多,所以無論是二度空間投影或是三度空間投影,都很難看出來是否有「同類資料分佈相近」的趨勢。
Data Clustering and Pattern Recognition (資料分群與樣式辨認)