公告

深度學習
深度學習(英語:deep learning)是機器學習的分支,是一種以人工神經網路為架構,對資料進行表徵學習的演算法。[1][2][3][4][5]深度學習中的形容詞「深度」是指在網路中使用多層。 早期的工作表明,線性感知器不能成為通用分類器,但具有非多項式啟用功能和一個無限寬度隱藏層的網路可以成為通用分類器。
深度學習是機器學習中一種基於對資料進行表徵學習的演算法。觀測值(例如一幅圖像)可以使用多種方式來表示,如每個像素強度值的向量,或者更抽象地表示成一系列邊、特定形狀的區域等。而使用某些特定的表示方法更容易從實例中學習任務(例如,臉部辨識或面部表情辨識[6])。深度學習的好處是用非監督式或半監督式的特徵學習和分層特徵提取高效演算法來替代手工取得特徵。[7]

資料探勘
資料探勘(英語:Data mining)是一個跨學科的電腦科學分支[1][2][3]。它是用人工智慧、機器學習、統計學和資料庫的交叉方法在相對較大型的資料集中發現模式的計算過程[1]。
資料探勘過程的總體目標是從一個資料集中提取資訊,並將其轉換成可理解的結構,以進一步使用[1]。除了原始分析步驟,它還涉及到資料庫和資料管理方面、資料預處理、模型與推斷方面考量、興趣度度量、複雜度的考慮,以及發現結構、視覺化及線上更新等後處理[1]。資料探勘是「資料庫知識發現」(Knowledge-Discovery in Databases, KDD)的分析步驟[4],本質上屬於機器學習的範疇。
類似詞語「資料採礦」、「資料捕魚」和「資料探測」指用資料探勘方法來採樣(可能)過小以致無法可靠地統計推斷出所發現任何模式的有效性的更大總體資料集的部分。不過這些方法可以建立新的假設來檢驗更巨量資料總體。

機器學習
機器學習(英語:machine learning,簡稱ML)是人工智慧的一個分支。機器學習理論主要是設計和分析一些讓電腦可以自動「學習」的演算法。機器學習演算法是一類從資料中自動分析獲得規律,並利用規律對未知資料進行預測的演算法。因為學習演算法中涉及了大量的統計學理論,機器學習與推論統計學聯絡尤為密切,也被稱為統計學習理論。演算法設計方面,機器學習理論關注可以實現的,行之有效的學習演算法(要防止錯誤累積)。很多推論問題屬於非程式化決策,所以部分的機器學習研究是開發容易處理的近似演算法。
機器學習已廣泛應用於資料探勘、電腦視覺、自然語言處理、生物特徵辨識、搜尋引擎、醫學診斷、檢測信用卡詐騙、證券市場分析、DNA序列定序、語音和手寫辨識、遊戲和機器人等領域。機器學習在近30多年已發展為一門多領域科際整合,涉及機率論、統計學、逼近論、凸分析、計算複雜性理論、資訊理論等多門學科。
參見:機器學習概述
定義
機器學習有下面幾種定義:
機器學習是一門人工智慧的科學,該領域的主要研究對象是人工智慧,特別是如何在經驗學習中改善具體演算法的效能。
機器學習是對能通過經驗自動改進的計算機演算法的研究。
機器學習是用數據或以往的經驗,以此優化計算機程式的效能標準。
另外,電腦科學家湯姆·米切爾在其著作的Machine Learning一書中定義的機器學習為[1]:
A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.
——Tom Mitchell,Machine Learning