聚類分析

目錄

心氣虛,則脈細;肺氣虛,則皮寒;肝氣虛,則氣少;腎氣虛,則泄利前後;脾氣虛,則飲食不入。

1 拼音

jù lèi fēn xī

2 註解

聚類通過把目標數據放入少數相對同源的組或“類”(cluster)裏。分析表達數據,(1)通過一系列的檢測將待測的一組基因變異標準化然後成對比較線性方差。(2)通過把用最緊密關聯的譜來放基因進行樣本聚類,例如用簡單的層級聚類(hierarchical clustering)方法。這種聚類亦可擴展到每個實驗樣本,利用一組基因總的線性相關進行聚類。(3)多維等級分析(multidimensional scaling analysis,MDS)是一種在二維Euclidean “距離”中顯示實驗樣本相關的大約程度。(4)K-means方法聚類,通過重複再分配類成員來使“類”內分散度最小化的方法

聚類方法有兩個顯著的侷限:首先,要聚類結果要明確就需分離度很好(well-separated)的數據。幾乎所有現存的算法都是從互相區別的不重疊的類數據中產生同樣的聚類。但是,如果類是擴散且互相滲透,那麼每種算法的的結果將有點不同。結果,每種算法界定的邊界不清,每種聚類算法得到各自的最適結果,每個數據部分將產生單一的信息。爲解釋因不同算法使同樣數據產生不同結果,必須注意判斷不同的方式。對遺傳學家來說,正確解釋來自任一算法的聚類內容的實際結果是困難的(特別是邊界)。最終,將需要經驗信度通過序列比較來指導聚類解釋。

第二個侷限由線性相關產生。上述的所有聚類方法分析的僅是簡單的一對一的關係。因爲只是成對的線性比較,大大減少發現表達類型關係的計算量,但忽視了生物系統多因素和非線性的特點。

特別提示:本站內容僅供初步參考,難免存在疏漏、錯誤等情況,請您核實後再引用。對於用藥、診療等醫學專業內容,建議您直接咨詢醫生,以免錯誤用藥或延誤病情,本站內容不構成對您的任何建議、指導。