當然,有些算法允許這些數據直接參與計算,比如分類算法中的決策樹和關聯規則。將非數字數據轉換為數字數據的最佳方法是將所有類別或有序變量的範圍從具有多個值的列轉換為僅具有真值的列。您可以將True值傳遞給True、False或0,1。這種符號轉換方法有時被稱為真理轉換。
具體代碼是:
導入熊貓為PD數據=,(5,10),(10,15),(15,20],可以設置每個盒子的名稱,比如1,2,3,4。
等寬法的缺點是裝箱的結果會受到最大值的影響。而且箱子的數量需要人為指定,這個要靠經驗。裝箱的結果會直接影響後續分類和聚類的結果。
2.等頻法:等頻法是指將壹組數據分解成n份後,每份的記錄數相同。等頻法通常由熊貓庫中的qcut()函數處理。