當前位置:外匯行情大全網 - 外匯開戶 - 歐幾裏德距離判別法、馬哈拉諾比斯距離判別法和費希爾判別法各有什麽優缺點?

歐幾裏德距離判別法、馬哈拉諾比斯距離判別法和費希爾判別法各有什麽優缺點?

總結如下:

1,歐氏距離又稱歐幾裏德度量和歐幾裏德度量,是距離的常用定義,是M維空間中兩點之間的真實距離。二維和三維空間中的歐氏距離是兩點之間的距離。

缺點:就大部分統計問題而言,歐氏距離不盡如人意。(每個坐標對歐幾裏德距離的貢獻相等。當坐標表示測量值時,往往會有大小不壹的隨機波動。在這種情況下,合理的方法是對坐標進行加權,使變化大的坐標比變化小的坐標具有更小的權重系數,從而產生各種距離。

當每個分量都是壹個具有不同性質的量時,“距離”的大小就與指數的單位有關。它等同於樣本不同屬性(即指標或變量)之間的差異,有時無法滿足實際要求。不考慮種群變異對距離的影響。

2.Mahalanobis距離是印度統計學家Mahalanobis提出的,表示數據的協方差距離。兩個隨機變量,且其協方差矩陣為σ的差異程度:若協方差矩陣為單位矩陣,則馬氏距離簡化為歐氏距離,若協方差矩陣為對角矩陣,也可稱為歸壹化歐氏距離。

這是壹種計算兩個未知樣本集之間相似性的有效方法。對於均值為μ,協方差矩陣為σ的多變量向量,樣本與總體的馬氏距離為(DM) 2 = (x-μ)' σ (-1) (x-μ)。在大多數情況下,馬氏距離是可以平滑計算的,但是馬氏距離的計算是不穩定的,不穩定的來源是協方差矩陣,這也是馬氏距離與歐氏距離的最大區別。

優點:不受維度影響,兩點間的馬氏距離與原始數據的計量單位無關。(它考慮了各種特征之間的關系(例如,壹條關於身高的信息會帶來壹條關於體重的信息,因為它們是相關的)並且是尺度不變的,即獨立於測量尺度);標準化數據和中心化數據計算出的兩點之間的馬氏距離(即原始數據與均值之差)是相同的。馬氏距離還可以消除變量間相關性的幹擾。

缺點:用小變化誇大變量的作用。受協方差矩陣不穩定性的影響,Mahalanobis距離的計算並不總是平穩的。

馬氏距離與歐氏距離的比較:

1,Mahalanobis距離的計算是基於整體樣本的,可以從上面協方差矩陣的解釋中得到。也就是說,如果取同樣的兩個樣本,放入兩個不同的總體,最終計算出的兩個樣本之間的馬氏距離通常是不同的,除非兩個總體的協方差矩陣恰好相同;

2.在計算馬氏距離的過程中,要求總體樣本數大於樣本維數,否則總體樣本協方差矩陣的逆矩陣不存在。在這種情況下,歐幾裏德距離可以用於計算。

  • 上一篇:農行的外匯業務 新聯業務 是怎麽回事
  • 下一篇:頻繁結售匯會被外管局拉入黑名單嗎
  • copyright 2024外匯行情大全網