半個(gè)多世紀(jì)前,浙江大學(xué)老校長竺可楨曾有兩個(gè)非常經(jīng)典的教育問題:“諸位在校,有兩個(gè)問題應(yīng)該自己?jiǎn)枂枺谝唬秸愦髞碜鍪裁矗康诙瑢懋厴I(yè)后做什么樣的人?”
半個(gè)多世紀(jì)后,以這位老校長名字命名的 “竺可楨學(xué)院” 求是科學(xué)班開啟了一位少年的求是之路。他就是本期采訪的主人公——彭靖田。
作為 5 月 25 日 - 5 月 27 日即將在杭州舉辦的 CTA 大會(huì)(官網(wǎng):https://dwz.cn/iSZ7BQUR)機(jī)器學(xué)習(xí)論壇演講嘉賓,彭靖田以谷歌技術(shù)專家的身份接受了 AI 科技大本營的采訪。
彭靖田,Google Developers Expert
谷歌技術(shù)專家(Google Developers Expert,GDEs)是這么定義的:來自全球各地經(jīng)驗(yàn)豐富的產(chǎn)品策略師、設(shè)計(jì)師、開發(fā)人員和營銷專家,積極支持開發(fā)人員、初創(chuàng)企業(yè)和公司以通過 web 應(yīng)用程序和移動(dòng)應(yīng)用程序來改變這個(gè)社區(qū);面向 Android、Angular、Dart、Flutter、谷歌云平臺(tái)、IOT、機(jī)器學(xué)習(xí)、web 開發(fā)等多個(gè)技術(shù)方向。
這么說起來,彭靖田與谷歌、與機(jī)器學(xué)習(xí)的淵源由來已久。
編程始于興趣,終于成長
從中學(xué)時(shí)代的信息學(xué)奧林匹克競(jìng)賽(OI)起,彭靖田就開始接觸編程和算法了。與絕大多數(shù)同齡人相比,這已經(jīng)非常早了,他卻自嘲:“我們班很多人小學(xué) 3 年級(jí)就開始編程,如今也在很多世界名校繼續(xù)攻讀 PhD”。相比起來,彭靖田在求是班反倒是接觸最晚的了。
彭靖田借用了一句老話,“興趣是最好的老師”。“可能我還是覺得 CS 這個(gè)學(xué)科本身比較有意思吧。高中階段帶給我啟蒙的主要是靠《算法導(dǎo)論》、 USACO 題庫、《浪潮之巔》,它們分別讓我窺見了算法、編程和行業(yè)歷史。”
光榮與夢(mèng)想,偉大不是終點(diǎn)
大學(xué)畢業(yè)后,彭靖田順利拿到 Special Offer 進(jìn)入華為中央軟件研究院。期間,他主要參與了深度學(xué)習(xí)云服務(wù)的設(shè)計(jì)和實(shí)現(xiàn),當(dāng)時(shí)的主要需求是支撐分布式機(jī)器學(xué)習(xí)訓(xùn)練和在線推理服務(wù)。
他想,如果抽象 TensorFlow 為一種容器作業(yè),并基于 Kubernetes 在容器調(diào)度方面的優(yōu)勢(shì),或許是一種實(shí)現(xiàn)路徑吧?說干就干,很快,彭靖田與同事一起開發(fā)了 DLKS (Deep Learning Kubernetes Scheduler)項(xiàng)目。
一年后,彭靖田加入當(dāng)時(shí)在容器技術(shù)領(lǐng)域頗有深耕的才云科技,主要負(fù)責(zé) AI 云業(yè)務(wù)線。但如何將容器集群管理技術(shù) Kubernetes 與深度學(xué)習(xí)框架 TensorFlow 結(jié)合也同樣存在不小的挑戰(zhàn)。2018 年初,彭靖田與 Google Cloud 一拍即合,決定參與到開源項(xiàng)目 Kubeflow 的推進(jìn)中來。
要知道,盡管在當(dāng)時(shí) TensorFlow 已是主流深度學(xué)習(xí)框架之一,被廣泛應(yīng)用于國內(nèi)外科技企業(yè),但它也存在某些缺陷。作為 Google 在 2017 年推出的開源項(xiàng)目 Kubeflow,旨在支持多種機(jī)器學(xué)習(xí)框架如 TensorFlow、PyTorch、Caffe 運(yùn)行在 Kubernetes 之上。
“這個(gè)項(xiàng)目的使命更加遠(yuǎn)大,一開始我們就希望它能夠充分利用 Kubernetes 的優(yōu)勢(shì),不僅支持 TensorFlow,還可以支持所有基于數(shù)據(jù)流圖(Dataflow)的機(jī)器學(xué)習(xí)框架。”
將機(jī)器學(xué)習(xí)革命推進(jìn)到底
2017 年下半年,一次偶然的機(jī)會(huì),彭靖田開始了解到 Machine Learning GDE 這個(gè)項(xiàng)目。“那會(huì)兒國內(nèi)應(yīng)該還沒有 ML GDE,才開始推廣。”
彼時(shí),他正與林健、白小龍合作撰寫《深入理解 TensorFlow:架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)原理》這本書。抱著希望能夠跟 Google TensorFlow 和 Google Brain 團(tuán)隊(duì)有更多交流和聯(lián)系的想法,彭靖田申請(qǐng)了這個(gè)項(xiàng)目。
談起這段經(jīng)歷,他仍記憶猶新,“第一輪面試是法國的一位 ML GDE,第二輪是 Google Cloud 東京團(tuán)隊(duì)的 Kaz Sato,過程很順利。”
“不要總看模型準(zhǔn)確率有多高,分布式規(guī)模有多大,而是要先了解業(yè)務(wù)本身,再根據(jù)已有資源設(shè)計(jì)相應(yīng)的解決方案。”如今,不少企業(yè)正嘗試搭建自己的機(jī)器學(xué)習(xí)云平臺(tái),在此過程中,卻又因缺乏人才而不免踩坑。
實(shí)際上,Google 一直在追求人工智能教育的普及,包括開放了 TensorFlow 這樣的高級(jí)項(xiàng)目。而如何幫助企業(yè)基于 Google 生態(tài)真正實(shí)現(xiàn)智能轉(zhuǎn)型升級(jí),是彭靖田這樣的機(jī)器學(xué)習(xí)專家們正積極推動(dòng)的事情。
以下為此次訪談實(shí)錄:
AI 科技大本營:從華為深度學(xué)習(xí)團(tuán)隊(duì)核心成員,到才云 Cloud AI 負(fù)責(zé)人,按照您核心技術(shù)路線的變遷角度來講,離不開基于 Kubernetes 作為機(jī)器學(xué)習(xí)部署平臺(tái)的思路。能否講講您是如何認(rèn)識(shí)到 Kubernetes 與 AI 結(jié)合的優(yōu)勢(shì)的?過去幾年,您認(rèn)為該項(xiàng)技術(shù)在落地應(yīng)用方面又發(fā)生了怎樣的顯著改變?
彭靖田:準(zhǔn)確來說,Kubernetes 之于 AI 不僅是部署,還是基礎(chǔ)設(shè)施(Infrastructure)。KDD 2017 年 收錄的《TFX: A TensorFlow- Based Production -Scale Machine Learning Platform》這篇論文給了我們一個(gè)很好的洞見。對(duì)于 Google 這樣擁有海量數(shù)據(jù)的公司來說,從 Mining 到 Learning,最后商業(yè)落地是一個(gè)順其自然的過程。不過,要想充分利用數(shù)據(jù)和模型,我們需要一個(gè)能夠支撐它的端到端機(jī)器學(xué)習(xí)平臺(tái)。
例如,Google 內(nèi)部多年以來使用 Borg(大型集群管理系統(tǒng)),基于 TensorFlow 打造這個(gè)平臺(tái)很穩(wěn)健,也很高效,但對(duì)于 Google 的外部用戶來說,我們認(rèn)為 Borg 可行的替代方案是 Kubernetes。事實(shí)證明,這條路還是可以走通的,雖然前路還有一些烏云。
跳出 AI 云或者機(jī)器學(xué)習(xí)平臺(tái)這個(gè)場(chǎng)景,云計(jì)算的技術(shù)變革趨勢(shì)已經(jīng)非常明朗,而 Kubernetes 的技術(shù)先進(jìn)性和生態(tài)使得我們現(xiàn)在可以更聚焦于應(yīng)用本身,而不再是基礎(chǔ)設(shè)施、軟件構(gòu)建和發(fā)布、網(wǎng)絡(luò)負(fù)載均衡等問題。現(xiàn)在已經(jīng)有很多企業(yè)在生產(chǎn)環(huán)境使用 Kubernetes,國內(nèi)規(guī)模最大的應(yīng)該是京東。
AI 科技大本營:目前,越來越多的企業(yè)開始在分布式機(jī)器學(xué)習(xí)云平臺(tái)上進(jìn)行相關(guān)部署,您認(rèn)為企業(yè)在做這一類的落地時(shí)需要注意哪些問題?如企業(yè)如何選擇適合業(yè)務(wù)的平臺(tái)和模型。
彭靖田:據(jù)我理解,應(yīng)該是越來越多企業(yè)在嘗試搭建自己的分布式機(jī)器學(xué)習(xí)云平臺(tái),而不是部署。
談到落地,我覺得絕大部分的矛盾和分歧是 “需求沒有理清楚”。現(xiàn)在這個(gè)行業(yè)最缺的就是既懂 AI 技術(shù),又清楚業(yè)務(wù)場(chǎng)景的人才。企業(yè)應(yīng)該多跟客戶聊一聊需求,而不是一味講“模型準(zhǔn)確率有多高,分布式規(guī)模有多大”。客戶更多關(guān)心的是技術(shù)是否解決問題。因此,正如你說的,先了解業(yè)務(wù)本身,再根據(jù)已有資源設(shè)計(jì)解決方案(包括算法、端到端模型、平臺(tái)等)。
AI 科技大本營:據(jù)您的觀察,目前什么類型的企業(yè)最先搭建了自己的機(jī)器學(xué)習(xí)平臺(tái)?在這個(gè)過程中,會(huì)遇到哪些挑戰(zhàn)?利用分布式機(jī)器學(xué)習(xí)平臺(tái)會(huì)成為未來企業(yè)進(jìn)行技術(shù)部署的主流趨勢(shì)嗎?
彭靖田:擁有數(shù)據(jù)的大企業(yè),更確切的講,是希望挖掘數(shù)據(jù)背后價(jià)值,洞察客戶真實(shí)需求的大企業(yè),如 Google、Uber、華為、京東等最先搭建了自己的機(jī)器學(xué)習(xí)平臺(tái)。
挑戰(zhàn)是多方面的,搭建一個(gè)類似于 TFX 這樣的平臺(tái),需要企業(yè)具備從硬到軟的技術(shù)實(shí)力。比如 Google 和華為都在研發(fā)自己的 AI 芯片、編譯器、框架和平臺(tái),這其中的難度和挑戰(zhàn)不言而喻。
在我看來,IT 到 DT 一定是未來趨勢(shì)。互聯(lián)網(wǎng)浪潮下,我們能看到整個(gè)原子世界都在不斷被數(shù)字化。機(jī)器學(xué)習(xí)就是數(shù)據(jù)驅(qū)動(dòng)的學(xué)科。未來所有的人和所有的行為都會(huì)被記錄下來,這背后的商業(yè)價(jià)值是巨大的。相信看過美國科幻電視劇《西部世界》的朋友會(huì)有這個(gè)洞察。
AI 科技大本營:您針對(duì) TensorFlow 撰寫了相關(guān)著作,并開發(fā)了一個(gè)專門的視頻課程,您認(rèn)為相比于現(xiàn)有的其他框架 (如 PyTorch 等),TensorFlow 的優(yōu)勢(shì)在體現(xiàn)在哪里?深度學(xué)習(xí)框架之爭(zhēng),最后會(huì)是什么結(jié)果?
彭靖田:TensorFlow 的優(yōu)勢(shì)主要體現(xiàn)在高性能、靈活、對(duì)大規(guī)模分布式訓(xùn)練的支持等。目前,TensorFlow 對(duì)于 Senior 用戶來說,足夠定制化,滿足了很多商業(yè)落地場(chǎng)景;但它也存在劣勢(shì),學(xué)習(xí)曲線對(duì) Junior 用戶不太友好,這也是 TensorFlow 2.0 要解決的重要問題。
現(xiàn)在談結(jié)果還為時(shí)尚早。AI 落地是未來三年里所有從業(yè)人努力的方向,而這也是真實(shí)需求定義框架的未來。互聯(lián)網(wǎng)(web 開發(fā))和移動(dòng)互聯(lián)網(wǎng)(Android)的爆發(fā),我們看到 Java 找到了自己的路。
現(xiàn)在的爭(zhēng)斗都是暫時(shí)的,是學(xué)術(shù)圈和小部分產(chǎn)業(yè)界的存量博弈。在 AI 大規(guī)模落地前,我們不知道框架會(huì)走向何處。
AI 科技大本營:對(duì)于希望入門機(jī)器學(xué)習(xí)并使用 TensorFlow 的學(xué)習(xí)者,您有哪些入門和進(jìn)階的建議?
彭靖田:可以看看我在知乎 “ 如何高效地學(xué)習(xí) TensorFlow 代碼?” 問題的回答。(鏈接:
https://www.zhihu.com/question/41667903/answer/123150582)
簡(jiǎn)單來講,還是搞清楚自身需求。你未來想成為做算法模型的、做平臺(tái)的、做落地應(yīng)用的,還是什么?當(dāng)這個(gè)問題明確,你就知道應(yīng)該深入了解 TensorFlow 的哪一層了。
AI 科技大本營:不久前竺可楨學(xué)院圖靈班也開始公布招收首批人工智能本科班,如何評(píng)價(jià)浙江大學(xué)在人工智能教育以及科研方面的優(yōu)勢(shì)地位?
彭靖田:據(jù)我了解竺院上一屆混合班 2/3 的學(xué)生選擇了 CS,浙大 CS 這一屆申請(qǐng)名校 PhD 的整體成績(jī)也不錯(cuò),看見母校越來越強(qiáng)很開心。談到優(yōu)勢(shì),我個(gè)人認(rèn)為還是自由的學(xué)術(shù)氛圍和優(yōu)秀的教學(xué)資源吧。浙江大學(xué)里有很多院士帶領(lǐng)學(xué)生做前沿課題,也有諸如像 MOOC 中國著名網(wǎng)紅老師翁愷這樣的優(yōu)秀教學(xué)隊(duì)伍可以進(jìn)行一線教學(xué)指導(dǎo)。本科教學(xué)也一直緊跟美國名校的教學(xué)模式,相信浙大的同學(xué)都有體會(huì)。
AI 科技大本營:那么,在本次機(jī)器學(xué)習(xí)專場(chǎng)中,您會(huì)針對(duì)哪方面的內(nèi)容和大家進(jìn)行分享?
彭靖田:來 CTA,與我們一起聊聊 AI 的技術(shù)與落地。本次演講,我將向大家介紹如何使用 TensorFlow 2.0 Alpha 快速開發(fā)和部署機(jī)器學(xué)習(xí)模型。同時(shí),我將介紹如何實(shí)現(xiàn) TensorFlow 1.x 和 2.0 模型之間的快速轉(zhuǎn)換。最后,我將介紹 TensorFlow 和 AI 為民服務(wù)的落地案例。
-
應(yīng)用程序
+關(guān)注
關(guān)注
38文章
3324瀏覽量
58814 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5557瀏覽量
122576 -
tensorflow
+關(guān)注
關(guān)注
13文章
330瀏覽量
61066
原文標(biāo)題:TensorFlow 2.0來了,為什么他卻說“深度學(xué)習(xí)框架之爭(zhēng),現(xiàn)在談結(jié)果為時(shí)尚早”?
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
嵌入式AI技術(shù)之深度學(xué)習(xí):數(shù)據(jù)樣本預(yù)處理過程中使用合適的特征變換對(duì)深度學(xué)習(xí)的意義
Samtec 技術(shù)漫談 | PCIe? 7.0,為時(shí)尚早?還是仍不夠快?

評(píng)論