建議先對缺失數據進行插補,嘗試正態線性回歸lm,看看結果是什麽。然後盡量考慮使用randomforest,也建議使用遊俠包的遊俠功能,快速高效,數據量大的時候區別明顯。
隨機森林在對特征的重要性排序時使用替換特征的方法。