相關學習推薦:python教程
python用於人工智能的方法:
為什麽選擇Python?
在數據科學和機器學習領域最重要的兩大程序語言就是Python 和R,Python 簡潔易學、應用範圍廣(不限於數據分析)且學習曲線平緩,適合作為第壹個入門的程序語言,透過pandas、SciPy/NumPy、sckikit-learn、matplotlib和statsmodels 可以進行數據分析的工作,適合工程任務和需要和網絡應用程序整合的項目。至於R 由於是統計學家開發的程序語言,則是擅長於統計分析、圖表繪制,常用於學術研究領域,建議也要有壹定程度的掌握。壹般情況下Python 和R 並非互斥,而是互補,許多數據工程師、科學家往往是在Python 和R 兩個語言中轉換,小量模型驗證、統計分析和圖表繪制使用R,當要撰寫算法和數據庫、網絡服務互動等情況時在移轉到Python。為了降低學習成本。
此外Python本身是壹種通用語言,除了數據科學外也可以廣泛使用在 網絡開發、網站建置、遊戲開發、網絡爬蟲等領域,當妳需要整合系統產品服務時,可以擔任壹站式的開發語言,更重要的是 Python 也可以當成 膠水語言非常輕易和 C/C++ 等效能較佳的語言整合。簡而言之,Python是壹種簡潔易學但功能強大,值得投資的程序語言,所以我們這邊先使用Python 進行介紹。
若對於Python和R 比較,這邊有兩篇文章可以參考數據科學界華山論劍:R與Python巔峰對決、Which is better for data analysis:R or Python?。
如何開始入門機器學習?
事實上,數據科學是個跨領域學門,在學習如何使用Python 進行機器學習過程中通常必須掌握以下知識:
機器學習算法
Python 程序語言和資料分析函式庫
線性代數 / 統計學等相關學門
專業領域的領域知識( Domain Knowledge )
為了掌握以上三大領域知識(我們先把焦點放在機器學習核心技法,暫時忽略數據科學中對於領域知識的掌握),具體來說我們可以有以下步驟可以參考:
1. 掌握基礎Python 程序語言知識
在線學習資源:
o Codecademy
o DataCamp(也可以學R)
o Learn X in Y Minutes(X = Python)
o Learn Python theHard Way
2. 了解基礎數學/統計學和機器學習基礎知識
o 可汗學院線性代數
o Introto Deive Statistics
o Introto Inferential Statistics
o Andrew Ng 機器學習課程
o Andrew Ng 機器學習筆記
o CarnegieMellon University Machine Learning
o MachineLearning Foundations (機器學習基石)
3. 知道如何使用Python 科學計算函式庫和套件
推薦安裝Anaconda,支持跨平臺多種版本Python,默認將數據分析、科學計算的套件裝好,自帶spyder 編輯器、JupyterNotebook(IPythonNotebook),可以提供壹個網頁版接口,讓用戶可以透過瀏覽器進行Julia、Python或R 程序的開發與維護。
o numpy:科學分析,ScipyLecture Notes 教學文件
o pandas:資料分析
o matplotlib:會制圖瞟
o scikit-learn:機器學習工具
4. 使用scikit-learn 學習Python 機器學習應用
o MachineLearning: Python 機器學習:使用Pytho?n
5. 運用Python 實作機器學習算法
o 感知器
o 判定樹
o 線性回歸
o k-means分群
6. 實作進階機器學習算法
o SVM
o KNN
o RandomForests
o 降低維度
o 驗證模型
7. 了解深度學習(DeepLearning)在Python 的實作和應用
o NTU Applied DeepLearning
o Stanford DeepLearning
o 深度學習(Deep Learning)自學素材推薦
o 深度學習Deep Learning:中文學習資源整理
想了解更多相關學習,敬請關註php培訓欄目!