人工智能(AI),可以說是科技信息時代的大飛躍,既具備一定的類人邏輯性,又具備強大的計算能力和數據存儲能力。雖然,目前業界并不處在一個良好的投資狀態,但AI 技術依舊被認為是下一個帶來巨大經濟效益,提高社會生產力的巨大突破點。
事實上,在過去的這兩年時間里,AI、機器人、自動駕駛等概念已經成為最前沿的文化、政治名詞。很多研究認為,我們目前正處于這樣一個技術拐點:計算能力更強更快,數據源更豐富,深度學習算法趨于成熟,專業的硬件(芯片)和開源代碼逐漸崛起,越來越多的實用性AI應運而生。
AI背后的三大推手:數據、芯片、算法
1、移動網絡大量普及 數據結構化或爆發
數據可以說是機器學習的關鍵。分布全球的無所不在的互聯設備,包括移動設備、物聯網等,使得非結構化的數據大量增長,也就是說,機器學習算法能夠用來模擬、訓練和測試的數據源更加充足。
僅以特斯拉互聯汽車為例,截至目前,特斯拉總行程78000萬英里,公司平臺額外驅動的互聯汽車也行駛了 100萬英里。無線運營方面,Verizon8月公布了新的傳輸標準,使得遠程傳感器聯通云端軟件的速度更快。同時,新的5G網絡也將促進傳輸數據,IDC預計截至2020年,年均數據量將達44澤字節(也就是44萬億字節),未來五年復合年增長率將達141%,大數據技術將逐漸滲透實用領域。
與此同時,移動網絡建立大規模數據庫和云端處理技術的成本也在不斷降低。智東西也曾在111期智能內參援引世界經濟論壇指出:預計不用三年,將有90%的人擁有被廣告商支持的無限的免費數據存儲。這是因為,硬盤驅動器的成本持續下降,激勵著數據的創造。事實上,近90%的數據是過去兩年中創建的。
2、GPU應用大勢 新硬件更適配并行結構
GPU被認為是低成本、高計算能力的處理單元,特別是針對云端服務和新的神經網絡結構,它能提高準確性和計算速率;贕PU的并行結構允許更快的機器學習培訓體系,遠遠優于目前廣泛使用的基于CPU的數據架構。此外,通過額外的顯卡網絡,GPU體系可以加快迭代,實現更為精確的快速培訓。
芯片浮點能力發展之快可以以NVIDIA GPU(GTX 1080)為例:該芯片性能為9T浮點運算,價值約700美元,也就是每G約8美分。參考1961年的IBM 1620,不考慮浮點運算能力的話,通過串聯實現的每G浮點運算需耗9萬億美元。
智東西也曾在102期智能內參中強調GPU的市場前景,并分析市場份額。相比于CPU,GPU 具有數以千計的計算核心,及強大、高效并行計算能力, 可實現 10——100倍應用吞吐量,特別適用于AI 海量訓練數據情形。目前深度學習解決方案幾乎完全依賴 (NVIDIA的)GPU。
3、算法不斷優化 大公司推動開源
越來越多的算法研究推動著深度學習的實用性,伯克利、谷歌、Facebook也紛紛公開自家的源代碼框架,也就是Caffe、TensorFlow和Torch。源代碼的開放吸引著越來越多的軟件開發者嘗試新的算法,不到一年,TensorFlow就以及該形成了一個活絡的存儲庫GitHub,作為目前最大的開發商合作網站。當然,并不是所有的AI都出自于開源框架。
AI產業的三大類布局
從技術更新周期來看,過去50年,計算機在摩爾定律的推動下不斷進步,僅僅在系統框架方面,計算能力、存儲容量帶寬、編程語言轉換都有很大的進展。參見90年代技術變革帶來的經濟繁榮,推動了軟件、硬件、網絡公司的整改。
公共軟件公司1995至今市值從2億美元暴漲到5億美元,只有2000年左右趨于平緩。顯然,AI也有這樣的趨勢,引領硬件、軟件、數據和服務提供商等領域的增長。事實上,谷歌、亞馬遜、微軟和Salesforce自2014年來就已經完成了17起AI相關的收購。
目前,科技大佬和風投人主要關注的有三個方面:DIY,也就是自主建立自己的人才和數據庫,推出新的AI棧,主要玩家包括微軟、谷歌、亞馬遜和百度;咨詢服務,為垂直和特定的領域提供專業的AI咨詢,如IBM的沃森;開發服務型AI(AI——aaS),如谷歌圖片識別模型。
1、DIY趨勢:云平臺和開源
高盛咨詢了各大公司和風投機構,總結認為,AI或者機器學習(ML)將被互聯網公司大量的使用,這就需要有效數據收集和相關人才稀缺。不過,隨著移動互聯設備和物聯網的普及,數據量越來越多,數據收集變得越來越容易。
目前,AI堆棧與其他前沿技術最大的區別在于,大部分的機器學習嚴重依賴于開源技術和基于云平臺供應商的服務。這是因為,AI和ML需要大量數據支持,并且按需計算。
目前,AI主要的基礎技術投資都來自于微軟、谷歌、亞馬遜等云服務提供者,其中,云運算的首選是GPU和FPGA,它們能夠進行并行的,快速的數據處理。很多公司都會購買這些開源或者云服務來幫助開拓客戶,減少運營成本。
2、咨詢服務:資本彌補技術差距
人才缺乏為IBM、埃森哲和德勒等公司的資訊服務營造了市場環境。因此,機器學習的相關人才有著非常大的機遇,甚至有組織舉行數據科學大賽,提供獎勵。
3、AI——aaS:或將造就最大藍海
AI需要獨特的數據集和專業的人才,這似乎使得五年內看到大量AI公司成為一件奢望。事實上,最可能的情況是,公司們利用AI提供商的數據和框架等來創造附加價值的AI服務,也就是API,研發AI應用程序是最基本的例子,尤其是圖像識別和語音識別等。目前,谷歌和微軟都提供收費API,開發者可以講該API嵌入自己的應用程序,提高產品定位和水平。
AI——aaS應用于垂直領域可以幫助大公司組合數據,構建機器學習模型,賣給合作伙伴或者客戶、供應商。初創公司也可以據此構建專門的數據集,用于諸如醫學成像、廣告、零售等領域。
值得注意的是,除了這些高端技術層面,跟我們更為密切的AI應用即聊天機器人(聊天程序,bots),這被認為是未來人機交互的入口,尤其是自然語言識別、訊息平臺和虛擬助手,是目前技術關注的關鍵點。
1、AI農業規模達200億美元
基于傳感器和衛星等技術提供的有效的視聽數據,機器學習有望幫助增加作物產量(即繁殖能力),減少肥料和灌溉成本,協作作物和牲畜疾病的早期檢測,降低勞動力成本,幫助收獲后進行分類物流,進入市場。
2、金融服務規模達340——4302億美元
機器學習和人工智能在金融服務行業有廣泛的應用,隨著數據集的豐富,AI可以用于投資決策、信貸風險概況等,利用更少的時間處理更為豐富全面的市場信息,提供專業可觀,甚至更準確的分析。
3、AI醫療每年能省540億美元
機器學習在醫療方面的可用性非常廣,能夠提供實時監測,幫助發現高回報的技術和藥物,幫助測試分析、優化治療。預計隨著機器學習的人工智能的技術逐漸成熟,將推動藥物研發過程,每年減少260億成本支出,同時還能驅動醫療信息高效化。
4、零售業年均消費540億美元省410億美元
線上對線下已經被證實是對傳統零售業的挑戰,電子商務可以積累大量的客戶信息,基于這些數據,AI零售可以幫助企業更好的為目標客戶服務,更有效的傳遞產品信息。
5、AI能幫助能源工程節約1400億美元
石油和天然氣行業的探測和采煉有時處在極端條件,因此設備和工藝的可靠性很重要,影響著項目的經濟效益。為了避免操作失誤,這個行業往往采用了過渡冗雜的工程化設備和過多的人力。事實上,AI可以幫助設計更為可靠的設備和流程,降低資本支出和運營成本,預計未來時間,基于AI的能源工程可以幫助節省1400億美元的開支。
可以看到,硬件、開源算法、云服務已經成為必爭之地。
1、谷歌:貫徹軟硬件結合的理念
谷歌,或者說現在的Alphabet,已經建立了獨一無二的AI檢索算法,在自然語言處理上面頗具優勢,并應用于谷歌搜索,預計還將在谷歌智能家居生態中大顯身手。公司的開源軟件庫/云計算平臺TensorFlow還在結合了很多前沿的硬件加速器,推出新的AI張量處理單元TPU。此外,收購的DeepMind也在擊敗李世石的戰役中一舉成名。
2、亞馬遜:籌備開源服務
亞馬遜AWS在云服務的布局已經頗具優勢,2015年4月,公司宣布推出機器學習服務亞馬遜ML,提供針對性的用戶體驗。今年5月,亞馬遜推出了自家的開源軟件DSSTNE,幫助建立深度學習開發庫。
3、蘋果:活躍的收購者
過去一年間,評估已經收購了Emotient、Turi、Tuplejump等AI創業公司,并雇傭了之前在NVIDIA從事GPU軟件項目的Johnathan Cohen,并找來Ruslan Salakhutdinov作為其AI研發部主管。Siri可以算作蘋果在AI方面最主要的成就之一,此外,蘋果大腦的傳言也甚囂塵上。
4、微軟:力推基于GPU和FPGA的云
微軟首席執行官納德拉介紹稱,微軟正在建立“民主化的AI(democratizing AI)”,目前AI研究小組員工人數超過5000人,目標在于改變人機體驗和交互技術,小娜是比較有代表性的一個成果。此外,公司還在建立基于GPU和FPGA的云(Azure)方面做努力。
5、Facebook:開源工具組建開發者社群
Facebook在AI方面的主要布局集中在建立開發者社群,開源Torch、Chef、fastText、BigSur 等一系列 AI 工具及資料庫,并推出具體的應用程序,比如已經出現的圖象識別、語音文字轉換和智能翻譯等。
6、Salesforce:建立云生態
2014和2015年,Salesforce開始利用自家電開發平臺執行云機器學習任務。公司還收購了Minhash,、PredictionIO、MetaMind等AI公司,目的在于建立云銷售、云營銷、云服務、云社區、云物聯網、基于云的應用程序等。
7、NVIDIA:借力GPU大勢
GPU在之前的計算機應用不多,但AI算法給了它莫大的基于,目前,幾乎所有的AI算法都采用了NVIDIA的GPU,雖然英特爾也在加快研發新的替代芯片FPGA,但目前來看,GPU依舊是比較好的選擇。借此大勢,NVIDIA還專門設計了全球首款針對深度學習的GPU架構(Pascal 架構) 。
8、英特爾:加快芯片研發
GPU的大勢讓英特爾感到了危機,英特爾收購Nervana systems和Altera,加快FPGA的推進,在運算速度和編程靈活性取得一系列進展。2016年中期,英特爾推出了至強二代,用于智能家庭產品的網絡服務和云服務。
9、Uber:合作汽車制造商
Uber在AI方面的主要布局更趨近于物聯網,尤其是汽車傳感器。2016年9月,Uber在匹茲堡推出了自動駕駛試點項目,并于卡內基梅隆大學教授、汽車制造商合作,研發基于傳感器獲得的數百萬數據點,建立安全、有序、自動的交通模式。
10、IBM:沃森成AI之星
IBM在AI方面的布局很早,公司在全球的AI研發每人元超過3000名,專利超過1400項,覆蓋云計算和硅納米科學,其超級智腦沃森在自然語言處理和模式識別、非結構化數據處理方面有著出色的表現,已經應用于虛擬代理,幫助金融、醫療等合作伙伴處理和分析數據。
11、中國方面:BAT著力構建神經網絡
目前,國內對于AI的支持力度也比較大,在學術方面也有很是很大的研究熱點。學術機構,以及百度、阿里、騰訊等公司也在語音識別、圖像識別、神經網絡、自然語言處理等方面都有重要的突破。