當前位置:外匯行情大全網 - 信用卡套現 - 關於機器學習應用有哪些問題不得不考慮?

關於機器學習應用有哪些問題不得不考慮?

機器學習是壹種方法,可以賦予機器學習的能力,使其完成直接編程無法完成的功能。但在實際意義上,機器學習是壹種利用數據訓練模型,然後利用模型進行預測的方法。

我們來詳細看壹個例子。

圖4房價示例

以國家話題之家為例。現在我有房子要賣了。我應該標記它多少?房子面積100平米,價格是1萬,1.2萬,還是1.4萬?

很明顯,希望得到房價和面積的壹定規律。那麽我如何得到這個規則呢?用報紙上的平均房價數據?或者參考其他類似地區?不管是哪種,好像都不太靠譜。

現在希望得到壹個能夠最大程度反映面積和房價關系的合理規律。於是我調查了身邊壹些房型差不多的房子,得到了壹組數據。這組數據包含了大小房屋的面積和價格。如果我能從這組數據中找出面積和價格的規律,那麽我就能得出房子的價格。

尋找規律很簡單,擬合壹條直線,使其“穿過”所有點,並且離每個點的距離越小越好。

通過這條直線,我得到了壹條最能體現房價和面積規律的規律。這條直線也是以下公式表示的函數:房價=面積* a+b。

上面的a和b是直線的參數。獲得這些參數後,我就可以算出房子的價格了。

假設a = 0.75,b = 50,那麽房價= 100 * 0.75+50 = 1.25萬。這個結果和我前面列出的654.38+0萬,654.38+0.2萬,654.38+0.4萬是不壹樣的。因為這條直線綜合考慮了大部分情況,是“統計學”意義上最合理的預測。

在求解過程中,透露出兩條信息:

1.根據擬合函數類型確定房價模型。如果是直線,那麽擬合的方程就是直線。如果是另壹種類型的線,比如拋物線,那麽擬合拋物線方程。機器學習有很多算法,壹些強大的算法可以擬合復雜的非線性模型來反映壹些無法用直線表達的情況。

2.我擁有的數據越多,我的模型可以考慮的情況就越多,對新情況的預測效果可能就越好。這是機器學習中“數據為王”思想的壹個體現。壹般來說(不絕對),數據越多,機器學習生成的模型預測效果越好。

通過擬合直線的過程,我們可以對機器學習的過程做壹個完整的回顧。首先,我們需要在計算機中存儲歷史數據。然後,我們通過機器學習算法處理這些數據。這個過程在機器學習中被稱為“訓練”,處理的結果可以被我們用來預測新的數據。這個結果壹般被稱為“模型”。預測新數據的過程在機器學習中稱為“預測”。“訓練”和“預測”是機器學習的兩個過程,“模型”是過程的中間輸出結果,“訓練”產生“模型”,“模型”指導“預測”。

  • 上一篇:工商銀行網上申請信用卡需要多少時間才能審批完成。
  • 下一篇:廣發銀行的賬單日和還款日怎麽算?
  • copyright 2024外匯行情大全網