近日,Marc Peter Deisenroth、A Aldo Faisal 和 Cheng Soon Ong 所著書籍《Mathematics for Machine Learning》的全部草稿已放出,機器之心整理了這本書的簡要概述。感興趣的讀者可從以下鏈接獲取全文(英文版)。
書籍地址:https://mml-book.github.io/
以下是這本書的部分序言。
機器學習是捕捉人類知識、對適合構建機器和工程化自動系統的格式進行推理的最新嘗試。隨著機器學習越來越普遍,軟件包越來越易用,自然而然地,從業者不會注意低級技術細節。但是,這帶來了一些風險,即從業者不了解設計決策,更容易忽略機器學習算法的局限性。對成功的機器學習算法的背后機制感興趣的從業者需要學習如下必備知識:
編程知識和數據分析工具;
大規模計算和相關框架;
數學和統計學知識,以及機器學習如何在其上構建。
在大學里,機器學習的基礎課程會先花時間介紹部分必備知識。由于歷史原因,機器學習課程通常屬于計算機科學系,學生通常接受過前兩項必備知識領域的訓練,但對數學和統計學知識可能涉獵不多。目前的機器學習教科書嘗試用一兩章的篇幅覆蓋背景數學知識,可能在書的開頭或者是附錄。而本書將介紹基礎機器學習概念的數學基礎,并收集相關信息。
為什么要再寫一本關于機器學習的書?
機器學習構建于數學語言之上,以表達看似直觀實則難以形式化的概念。一旦得到恰當的形式化,我們就可以使用數學工具推導出機器學習算法設計的選擇結果。這幫助我們理解正在解決的任務,同時了解智能的本質。全球數學專業的學生常見的一種抱怨是數學話題似乎與實際問題沒有什么相關。我們認為機器學習是促使人們學習數學的直接動力。
本書旨在作為構建現代機器學習基礎的大量數學文獻的指南。我們通過直接指出數學概念在基礎機器學習問題中的有用性來促進對數學概念學習的需求。為使書籍盡量簡短,我們省略了很多細節和高級概念。本書主要介紹基礎數學概念及其在機器學習語境中的意義,讀者可在章節最后找到進一步學習的大量資源。對于具備數學背景的讀者,本書提供簡潔但表述準確的機器學習概覽。與主要介紹機器學習方法和模型或編程知識的書籍不同,本書僅提供四個代表性機器學習算法。我們主要關注模型背后的數學概念,并描述其抽象之美。我們希望所有讀者能夠通過數學模型中的基礎選擇更加深入地了解機器學習應用中出現的機器學習基礎問題和相關的實際問題。
目標讀者
隨著機器學習應用在社會中的廣泛應用,我們認為每個人都應該了解其背后的原則。本書以學術數學風格寫成,可以幫助讀者準確理解機器學習背后的概念。我們鼓勵不熟悉這一風格的讀者堅持閱讀本書,并牢記每個話題的目標。我們將在文本中插入大量評論,希望可以幫助讀者獲取對全局的理解。本書假設讀者具備中學數學和物理知識。例如,讀者應該了解過導數和積分,以及二維三維幾何向量。因此,本書的目標讀者包括本科大學生、夜校學生和參與機器學習在線課程的人們。
本書結構如下所示:
第一部分:數學基礎
1. 引言和動機
2. 線性代數
3. 解析幾何
4. 矩陣分解
5. 向量微積分
6. 概率和分布
7. 連續優化
第二部分:機器學習核心問題
1. 當模型遇到數據
2. 線性回歸
3. 利用主成分分析進行降維
4. 利用高斯混合模型進行密度估計
5. 利用支持向量機進行分類
我們可以用以下兩種策略來理解機器學習中的數學:
按從基礎到高級的順序構建概念。這通常是偏技術性領域(如數學)的首選方法。該策略的優點是,讀者可以隨時依賴自己以前學過的定義,不會遇到那些晦澀難懂、難以接受的觀點。但對于從業者來說,許多基礎概念本身并不怎么有趣,因此大多數基礎定義會被他們很快遺忘。
從實際需求向下挖掘出更基礎的要求。這種目標驅動方法的優點是,讀者隨時都知道為什么他們需要研究特定的概念,并且清晰地知道自己需要哪些知識。這種策略的缺點是知識的基礎并不穩固,讀者必須記住一組自己并不理解的單詞。
本書分為兩部分,第一部分講數學基礎,第二部分將第一部分的概念應用于基本的機器學習問題中,繼而形成了圖 1.1 中闡述的“機器學習四大支柱”。
圖 1.1:機器學習的基礎和四大支柱。
第一部分關于數學
我們將數值數據表示為向量,并將這些數據的表格表示為矩陣。向量和矩陣的研究被稱為線性代數,見本書第 2 章。
評論