聚類分析是壹種無指導的分析,如果理解聚類的核心含義,妳就能明白,聚類的數量是沒有標準的,必須人為設定,但是特殊的聚類方法可以給妳壹些參考,比如:系統聚類,它可以生成聚類樹,這樣妳就能直觀判斷分成幾類合適。再比如:二階聚類,系統模型會自動選擇分成幾類(如果不人為設定)。
聚類是無指導的訓練樣本,分類是有指導的訓練樣本,分類就是通過已知的樣本建立分類規則,來預測新樣本的分類,為什麽是有指導的?因為分類是用樣本的其它屬性來解釋、預測我們感興趣的屬性的模型,這是白話。舉例:我們知道壹批用戶的人口統計變量、消費、工資和貸款還款情況,現在我們要用用戶的人口統計變量、消費、工資來對用戶的貸款還款情況進行預測,這就是分類模型,在這裏要用到分類決策樹。就是說我們用樣本的其它屬性來對樣本的貸款還款情況建立分類規則,然後對未來的新樣本進行預測,判斷新用戶是否是理想的放貸對象