2017中國(深圳)IT領袖峰會在深圳舉行。在上午第一場高端對話《人工智能:中國機遇與挑戰》中,李彥宏表示,他認為電腦永遠達不到人腦的水平。
他不認可人工智能是一種仿生學,因為人類對人腦的認識目前只有3%,在這種情況下沒法去教電腦。人工智能目前非常初級,要讓人工智能完全達到人腦的水平,這個時間還非常非常長。這個說法是比較保守的,其實是永遠達不到的。
李彥宏透露,2012年陸奇告訴他,人工智能要進入使用階段了,回國后,經過思考開始布局人工智能相關研究。
他回憶了百度投入人工智能的歷程,他推翻了自己說過的話。之前他曾說百度是一個商業公司,不應該成立單獨的研究院,百度的研究應該和業務結合起來。但是深度學習完全不一樣,他當時意識到應該有戰略布局、系統研究,所以成立了單獨的研究院。2013年1月,對外宣布成立深度學習研究院,這是在全球工業界第一個以深度學習命名的研究院。
李彥宏認為,人工智能不是一個簡單的技術,人工智能是堪比工業革命的新的技術革命。互聯網是開胃菜,人工智能才是主菜。(溫泉)
以下是全部對話實錄
主持人:讓我們再次以熱烈掌聲感謝馬云先生的精彩演講。女士們、先生們,下半節大會將轉入高端對話環節,由數字中國聯合會主席吳鷹先生主持,大家歡迎!
吳鷹:請李彥宏先生、馬化騰先生先上臺。大會主辦方給我一個很好的好主意,BAT三巨頭在一塊兒在IT領袖峰會照相。讓他們三個人照張相。剛才馬云講他們都是有技術實力的公司,
我們繼續請沈向洋先生、郭為先生上臺。
IT領袖峰會比較重要的重頭戲是高端對話,每年都是我主持的,每年的高度都越來越難了,特別是在馬云的精彩演講之后。我覺得我今年又做了一個很正確的事兒,我跟馬云通電話的時候,我說不設他講什么,讓他隨便講。我告訴他我們的主題是什么,其實他講的很多問題非常重要,有些東西沒有展開。但是我想對大家是很有幫助的。
時間關系,我們把休息時間也給去掉了。對大家表示抱歉。IT領袖峰會今天開會的時間稍微往后拖了一點,是因為我們大屏幕IT設備出了點問題,用了最新技術調試有點問題,我表示抱歉。這不是深圳市政府的問題,是數字中國的問題,我們是IT行業嘛。
這次IT領袖峰會主題叫做邁進智能新時代。我們上臺的幾位嘉賓,李彥宏先生、馬化騰先生大家都很了解了,我不再介紹了。郭為先生是神州數碼,當年的聯想二少帥之一,沈向洋現在大家不一定很熟悉,他是我們著名的微軟公司的執行副總裁,全球研究院的院長,人工智能部門的總負責人。同時也是美國工程院外籍院士。這個外籍要強調一下。這幾位嘉賓都是這些領域和行業里的領頭人。
先從馬化騰開始。剛才朱民演講中特別舉了你們這個團隊的例子,我也看了這篇報道,他們13個人真的是沒有一個人是會下圍棋的,騰訊有一個700多人,成立了大概一年多,人工智能團隊專門研究人工智能,他們在很短時間內聚集了很厲害的一些專家,能不能跟我們大家分享一下騰訊為什么在人工智能上這么重視,你對人工智能的看法和行業的看法,剛才馬云講你們都是很有技術實力的公司,能不能分享一些你們的干貨。謝謝!
馬化騰:其實李彥宏是人工智能走得更前了,對騰訊來說我們還是落后不少。只是去年剛開始成立的部門。當然在我們所有BG內部結合它的業務形態,像我們微信里面,超過上百億條消息,包括我們圖片、特別是做社交網絡,里面有人臉數據圖片絕對是天文數字,每天高達上十億張有人臉照片。這方面的技術研究在各個BG有相當長時間研究。包括后臺數據分析、廣告匹配都用了人工智能技術,只是大家感受不到。因為他在后端。我們在前端也希望做出一些產品,剛好一年前Alpha Go它的paper出來,通過人機對戰讓全世界對人工智能認知到了一個新的高潮。我們團隊本著練兵的心態也做了嘗試。
谷歌收購了deepmind團隊發表的論文,原來做計算機圍棋的團隊都紛紛采用深度學習方法來融入原有的似乎已經走進瓶頸的計算機圍棋軟件開發中,大家不約而同在這一年中起步。我們內部團隊有三個團隊也在做,只是分在不同部門。這個部門剛好是它能夠突破這個瓶頸,也動用了公司相當的大的后端的計算機資源,更大的特點是它和Alpha Go不同的是我們的決議AI的成長,全程得到了國家級圍棋世界冠軍從一開始的陪練,然后找出它為什么不同。我們十幾位研發人員不懂圍棋的,一開始連黑先下還是白先下的規則都不懂,我們從計算機原理、工程實現以及結合中國包括很多的專家來去訓練,這里面給我們最深刻的理解就是,我們覺得這算是小小的成功吧,但是也不能過于欣喜,畢竟是站在前人肩膀上,因為你沒有發布這個paper,我們也不可能做出來。但是也不能說這是毫無疑義的事情,這里面給我們最大的思考。過去我們對AI很多是從一些規則、從簡單的訓練得出來的能夠改善我們計算處理的這樣一種能力,最終我們發現其實還有一個更恐怖、更深層的意義在于他能夠在計算機的后臺能夠用云計算、大數據方式能夠高速的自學習,能夠自己跟自己對奕。所以AlphaGo出來后,它的下一代master,經歷了數十億盤自我對弈,已經超越過去所有人類交戰的盤數,然后它自己尋找規律,找到的已經遠遠超過人類過去在圍棋領域認知的范圍,是極大的擴展,這是給我們一個很大的啟示。
在很多的領域——圍棋以外的領域,不管是醫療(剛才講的病理的檢測),以后的金融,現實中的每個行業,如果能用計算機后臺做出一個模擬器,能夠讓它充分嘗試,就像開車一樣,你可能不用教自動駕駛怎么開車,就模擬一個現實環境,給它一個規則,讓它駕駛,它去撞,有各種反饋,自然會琢磨出一套理論和經驗,這是給我們帶來巨大思考。在很多領域如果能做出模擬器,定義出很多參數,自己學習,他能找到規律可能遠超我們現在想象的。這是我們最大的啟示。
吳鷹:謝謝Pony。沈向洋先生作為微軟人工智能事業部的負責人,你講講為什么人工智能這幾年能有突破性發展,能不能預測一下最可能在哪些領域具有顛覆性的應用出現?
沈向洋:謝謝吳鷹。我每次聽完馬云講話以后都沒有話可以講,馬云基本上把大家想講的都已經講完了。再次感謝Jack精彩的演講。謝謝吳鷹問我這樣一個問題。
我從研究生開始學習人工智能,也有20、30年時間了。現在看到人工智能如火如荼,非常激動。因為我們90年代中畢業的時候出來的時候工作都找不到,現在大家恨不得見到一個懂人工智能都投錢。人工智能經歷了多少個冬天,之所以今天有這樣的發展機會,主要還是因為三個方面原因,第一件事情,是因為互聯網的出現,互聯網+物聯網提供了更多的數據。第二件事,強大的運算能力。摩爾定律到現在,大家覺得應該會死掉,但是還沒有死掉,還有更多新的計算方法。第三,過去五六年深度學習突然突破,包括騰訊研發領域充分運用到深度學習,令到大家突然看到很多不能解的問題現在可以解掉。
從人工智能基本和研究方向來講,還是兩個不同非常不一樣的階段。一個是人類感知這件事情上,我們講人工智能,原來對人工智能的定義就是跟人類智能相比較。人類的智能體現在哪?主要是兩方面,一個是感知方面、一個是認知方面。感知方面,剛才我提到這幾個原因,所以在接下來5-10年進展會非常快。具體表現在計算機語音和計算機視覺發展,我覺得AI會超過人。很多人會同意我這個說法。第二方面問題大家今天還沒有搞的很清楚的地方是人工智能的認知方面,包括自然語言,包括知識的獲取、包括你對一般的情況下這種解決的方法這樣的思考,包括情感,這些東西今天我們還都是不知道。所以我是覺得現在是非常好的時代。激動之余的話,我覺得我們作為科研人員還是要有一個平常心,因為很多科研進展還需要一些時間。
您剛才提到現在人工智能給大家創造了一些什么樣的機會。我覺得剛才朱民在他的主題演講里面說的很好,包括在中國的一些人工智能的機會、包括美國的機會。從微軟公司來講,我們的研判覺得短期之內是有非常非常大的商機,你看到底有那些行業已經相對而言有相當量的數據,而且同時在這個行業里面從事人員是不高興的,那你就有商機了。如果這樣看的話,到今天來講,幾乎所有的商業應用,從市場銷售到HR部門招聘,到客戶支持這方面,所有的都會被顛覆掉。我是覺得接下來可能是五年最多的AI應用的商機,我這樣講并不是說自動駕車不重要、圍棋下棋不應該做研究。只是具體回答吳鷹的問題,從我們來講最大的商機在哪,就是每一個商業應用都會被顛覆掉。
吳鷹:大家注意沈博士說每一個商業應用都會被顛覆掉。這是非常震撼的一個結論。郭為先生,你是神州數碼的掌舵人,你們在智慧城市方面有很大的布局,很多人會認為你們好像跟人工智能不一定有那么大的關系。請你談談你對人工智能的看法。
郭為:謝謝吳鷹。剛才沈向洋講到今天人工智能有一個比較大的突破,實際上就是三點,一個是由于互聯網出現,大數據出現。第二,計算能力高速度。第三,算法。我們做智慧城市過程中,我們為企業定位過程中也考慮到,計算能力這個事兒我們做不了。第二,算法上。昨天研討會上,還有今天,大家認為中國目前還是落后、還是在學習階段。作為一個傳統企業轉型的話,唯一能做的就是數據。就是如何能夠采集到更多數據。由于我們以前的積累,我們在很多行業有很多應用,使得我們能夠接觸大量的數據,這些數據如何從傳統的方式上轉移到用互聯網方式,或者今天我們定義用深網數據挖掘,如何在三網環境下采集數據就變成我們的核心競爭力。所以做智慧城市過程中我們是不斷探索這樣的工作,慶幸的是由于我們跟北大合作,使得我們在深網挖掘上有很大的變化,我們發明了相關技術,使得快速生成API,為智慧城市打造了一個基于大數據操作系統,如何能夠快速形成一個城市數據,然后進行分析、應用,這就是做智慧城市的實踐,正是因為這樣一個實踐,我們花了6、7年時間,某種程度上也是碰得頭破血流,我也很同意馬云的觀點,我們既不能把人工智能太深化,但是也要看到他確實還是能夠幫助我們做成一些事情。比如在一些特定領域里,在醫療看片子、制定醫療方案可以做的很好。比如在農業,由于土地確權,我們掌握了20億畝土地的信息,土地上有什么數據,我們幫助進行分析,提升我們農業收入,包括進入扶貧領域。這些應用是做智慧城市過程中一個非常好的方面。
總的來講,既要發揮神州數碼在傳統IT領域的應用上的特征,另外就是擁抱互聯網,擁抱大數據,如何在這個領域里面有一些技術性的突破,使得我們自己的企業能夠在這個領域做一些事情,這就是我們今天做智慧城市要做的工作。
吳鷹:百度在人工智能布局很早,而且深度學習上比美國很多大公司還要領先,這種評價并不過分,而且你在兩年前全國政協大會上提出中國大腦這個建議。對中國也是非常重要。從百度角度你能不能談談關于人工智能發展你們的看法。當年你們為什么那么早做這些布局。
李彥宏:我其實也思考過這個問題。從百度的基因來說,我們從一開始成立到現在最主要是做搜索。搜索本質上是機器試圖理解人想要的東西。我們一開始用各種各樣計算機方法試圖理解人的意圖。我在想一個問題,深度學習在圖像檢索里頭的效果不錯,是一個偶然還是它代表一種趨勢。分析完之后,覺得它是代表一種趨勢的,它不僅僅對于圖像搜索有用,它對很多其他計算機科學要解決的問題都是非常有用的。原因就是說,隨著互聯網這么多年發展,數據越來越多,越來越豐富,計算資源越來越便宜,越來越強大,所以人工智能剛才說有60年歷史,前50年,為什么大家不看好,為什么大家覺得人工智能沒有用,我在美國讀書的時候,我就很喜歡人工智能這門課,但是學完之后,教授告訴我說其實沒用,人工智能沒有一個真正有商業價值的應用,你將來靠這個是找不著工作的。到現在最近幾年,原來認為沒用東西變成有用,是因為市場環境變了,條件變了,原來認為不可能的事情現在變成可能了。分析了環境因素之后,覺得人工智能是代表未來的。所以我們在2013年1月份對外宣布成立深度學習研究院,這個可能是全球工業界第一個用深度學習來命名的這么一個研究院。而且等于我自己食言了,我2013年以前不斷跟外界說我們是一個商業公司,我們不應該成立研究院,不應該搞純的研究機構,這些機構要想轉化成產品,進入市場被市場所認可的話,應該跟那些產品部門、跟那些業務部門緊緊結合在一起,而不是單獨成立一個研究院,但是深度學習這一波起來之后,我覺得是完全不一樣的東西,他需要在理論上、在算法上,在很多方面有長遠的布局和突破,所以從那個時候開始大規模投入去吸引人才,去推進算法,其實不光是算法,在剛才朱民講的時候也講到各種各樣芯片結構層、CPU到GPU等等,都要審視算法的需求。所以現在看起來人工智能比2013年我們決定進入的時候一個更要大的產業。前一陣我對外講了,互聯網其實現在只是一道開胃菜,真正的主菜是人工智能,所以人工智能不是互聯網的一部分,不是互聯網第三個階段,它是堪比工業革命一個新的技術革命。
吳鷹:開胃菜已經更大了,互聯網是人工智能的開胃菜,媒體可能會引用這個論斷,但是主菜得多大的市場。我覺得你跟沈向洋說的顛覆所有的商業模式,這個影響是非常大的。沈向洋,微軟人工智能事業部有多少人?
沈向洋:一共有7000多個工程師和科學家,我們還在繼續招人,并且Pony和Robin經常來挖我們的人,Jack也挖。
吳鷹:沈博士就直接進入火藥味比較濃的階段的,我還沒有進入,他就先開始了,我就拿你先開刀,你必須回答這個問題,不能用中國人的圓滑來回避,馬云也坐在這里,我們先饒了郭為,微軟如果進入中國,已經進入了,人工智能市場的話,BAT,你最想干掉馬云、馬化騰還是李彥宏?
沈向洋:借助剛才馬云講的,彎道超車十超九翻,要換道超車才有希望,在任何競爭的過程中總是要找到自己的出發點,既然你給我這樣一個機會的話,我就提一下,微軟在中國最近這幾年推出的最了不起的人工智能叫微軟小冰,我不知道在座的有沒有用微軟小冰,可能在座的不是我們面對的用戶群,我這樣講你不要生氣,我們的用戶群是18-24歲相對的年輕用戶群,大家有時間和智能聊天機器人,這也是為什么我們選擇跟Pony這邊的QQ合作,也是針對這樣相對年輕的用戶群。之所以我提這樣的人工智能產品和一般的智能助理還不太一樣。人類進化多少萬年下來以后,每天講很多的話,你可能不知道,其實男人在一天大概講幾千句話,女士一天可能講超過一萬句話。大多數的話并不是說講一句話一定要完成一件什么工作,我老師講大多數人一天講的話很多都是廢話,但是這個講話很重要,講話是人工智能里面最重要的一件事情,在很大程度上你的EQ是體現在你怎么去講這個話。我們推小冰的過程中學到了很多東西,我們現在主推的方向,研究和產品的方向就是所謂的對話式人工智能。
吳鷹:我沒用過小冰,但你好像還是沒有直接回答我的問題,你最想先干掉誰?
沈向洋:你剛才問了什么問題?
吳鷹:高手。他用了馬云說的彎道超車就會翻車,智慧城市,你知道政府對市民的服務可以歸結到人的服務有多少項嗎?3000項,一個人,深圳將近2000萬人,乘以3000,在各種狀態下,數據量很大,數據量大不等于大數據,他這個角度,有很多東西還是可以做出一些結論出來。我也想借馬云剛才講的問一個仿生問題,飛機剛出來之前,大家想的思路是看鳥在空中飛很羨慕,剛開始做飛機就想做一個像鳥一樣的。我就想問臺上的四位嘉賓,不用專業知識,就是知覺,在人工智能上有突破的事,模仿人腦的,馬云說機器一定比人快很多,你們覺得仿人腦的方式會有所突破,還是完全不一樣的想法?郭為你就先說,說錯了也不要盡管,反正你也不是人工智能專家。
郭為:是功能性的突破,還是仿生的東西,就拿AlphaGo來講它下一盤圍棋所消耗的能量,有人告訴我需要2噸煤,但是一個圍棋手可能就是兩碗米飯,我們在考慮一個功能的時候需要多大的資源消耗,這始終就是人類進步的很重要的,你可以實現這個功能,從實驗室走到工業,實驗室可以做得出來,但是無法實現工業化就是要考慮成本,考慮到資源的消耗。人工智能之所以用功能性替代就是考慮這些因素,就是完全模仿本身也非常困難。我也非常同意馬云的說法,人的大腦功能,我們自己認知只有3%,最終就是用功能,而功能的替代能量消耗要比人本身,人還是太神奇了,這個我覺得很難達到人的程度。我最近看一本書《人的宗教》,就講人是由三個東西構成,一個是你的生命,一個是你的心智,第三個是你的心靈或精神。我們反過來講精神的東西,我無法想象機器能夠代替精神的東西,最多也就是體力上能夠替代,智慧上不能,在某些方面的替代,完全替代人不可能,某些替代就是功能上的替代,所以突破就在功能上的替代,然后提高一定的效率,這是我對人工智能的看法。所以我為什么同意馬云的觀點,實際上機器怎么樣能夠做得更好。我看遠古的博物館,人類發明一個針,這和今天人工智能的發明對人的沖擊是一樣的,當時人縫不了衣服,沒有針怎么縫衣服,發明針是多么神奇的事,能夠把衣服縫起來,今天做人工智能也和當年發明針沒有根本的區別,人在進步的過程中不斷發明新的工具,而新的工具最終還是為人類服務的。
吳鷹:Pony覺得是用模仿人的方式,還是全新的?
馬化騰:我們當然期待有一個本質的,發現飛機的螺旋槳也好,還是流體動力學,還是鳥的翼,或者是馬跑,現階段還是通過仿生的階段,在某一些垂直的領域,你現在要做到一個通用的AI非常難,包括圍棋也是選一個非常窄的領域,然后給它學習,通過各種參數來訓練,剛才郭為提到的用AlphaGo下一盤棋要消耗多少能源。這個垂直領域訓練數據是需要消耗很大的能量,但在實際用的時候其實不需要消耗太大的能量。我們絕藝訓練出來的單機成本跟職業棋手差不多,但是要訓練出這個模型來要很長時間,稍微改一改規則就全部要進行重復訓練,改進一點之前的積累都不算,要從頭積累一遍,消耗的能量很大,而且時間很長,這是很窄的一個技能模擬。下一步到通用的,再下一步是不是有更本質性的,發現它背后的原理,智能可以超越人的碳基的智慧,是不是有其他更多的基礎元素可以形成更高級的生命智慧呢?這可能是超越人類現在所發現的知識,這也是有可能的。甚至有人還突發奇想說我們現在認識的宇宙就是高智能的生命,用他的量子計算機模擬出來的環境,我們一切都是模擬出來的,也有可能。大家發揮腦洞大開的想象力吧。
吳鷹:腦洞大開,一切皆有可能,Robin怎么看?
李彥宏:其實我不太認可人工智能現在做的是仿生學,現在我們講人工智能像是人腦神經元的工作原理,但是人腦具體怎么工作的,剛才馬云講的我們只了解3%,我們并不知道人腦是怎么工作的,你不知道它怎么工作怎么仿它?我們只知道這一點點,這一點點計算機的算法有一點類似之處。我同意現在的人工智能,尤其是機器學習、深度學習的算法還確實處在非常初級的階段,還有很多提升的空間,現在做得還非常不夠。什么時候能夠挑戰真正人的認知能力,我覺得還有很長很長的時間。我說話比較保守,我說很長是說這一天永遠不可能來到。第一階段是弱人工智能,第二階段是強人工智能,第三階段是超人工智能,我認為到強人工智能這個階段就達到不了,不僅僅是你永遠搞不清楚人腦是怎么工作的,你即使用電腦的方法模擬人腦,要想完全達到人腦的水平,我覺得也做不到,永遠做不到這件事情。
吳鷹:我們IT領袖峰會就是觀點。我也不用問沈向洋了,因為確實是人腦到底怎么工作的,不知道。但是這個答案非常簡單,因為有一個上帝。所以很多科學家到最后就信上帝了,變成找到一個答案了。沈向洋,你還有補充?
沈向洋:我蠻贊成李彥宏剛才講的,人工智能這件事情發展,今天最大問題是對人腦不了解。腦科學今天還是非常初步的科學,你每次要講科學的話,首先要一定要有數據,要能夠做試驗,而且做重復的試驗,今天就沒有辦法真正監測到真正做試驗說因為加入了這樣的輸入到人腦,出現什么樣的輸出。接下來N年應該有更多的人投身基礎科學研究腦科學這件事情。看今天計算機體系結構,馮諾伊曼結構,跟人腦結構完全是兩碼事。可能也像張教授說飛機的模仿并不是真正像鳥一樣,我覺得肯定是這樣的情況。接下來很多方面肯定叫弱人工智能也好,這些很多的人的智能方面我們能夠想象得出來,今天人能夠做的事情在不遠將來,絕大多數事情,人工智能都可以達到。我舉一個小的例子,比如今天大家講你今天可以做視覺識別了,物體識別了,你今天可以做語音識別了,那今天人還有什么事情很了不起,大家覺得通過學習的方法,我們可以達到一個什么樣的高度。很重要一件事情是機器閱讀,閱讀的能力。我要考高考、考SAT,閱讀一篇文章后,你問一個問題,我可以答一個問題。像這樣的問題接下來5-10年可能是人工智能很大突破的地方。而一旦有突破后,搜索也好、社交網絡也好、其他商業應用也好,有很多這樣的機會。今天大家覺得激動人心的地方是因為以前是完全符號式、公式這樣做,今天是神經網這樣一種解法,它的區別在于以前符號式做法,你覺得用符號式做法解了一個問題,你覺得可以懂的,你可以解釋的。而今天這種神經網解法,包括Pony做的圍棋機器人,他很難去解釋為什么下這個。接下來有一個需要研究的問題,從符號式到神經式怎么樣回過頭再到符號式。就是研究行業很熱門的方向,叫做可以解釋的人工智能。
吳鷹:咱們講了這么多人工智能的話題,講一點跟在座嘉賓更接近一點的,我本來想問李彥宏怕不怕微軟,想不想把它干掉,但是沒有什么意義,他們都有很智慧的回答,肯定會回避開。但是我注意到百度你們的深度學習有一個開放平臺,咱們小公司在這方面沒有投入,沒有技術積累,想要用也是可以用,是免費開源平臺。這個是挺有意義。但是你們當年決定這么做的時候,你們不覺得這樣開放后會培養你的競爭對手嗎?
李彥宏:我覺得人工智能是一個非常大的產業,而且是會持續很長時間。像我們現在的判斷未來20-50年都會是一個快速發展的人工智能時期。在這種時代大潮下,顯然不是一個公司能夠把所有的事情都做下來的。相反的,如果說我們先進入了這個領域,能夠提供一些平臺給一些尤其是沒有這么多計算資源、沒有這么多做長遠研發能力的機構去做他們擅長的,他們對于很多垂直領域可能比我們的了解就會更加深刻,讓他們去做的話,他會推動整個人工智能技術的發展。所以從這個意義上講,我們把我們的平臺開放出來,對大家有益,對我們也有益,我們可以在平臺上看到大家在干什么事情,哪些方向發展會更快一些,哪些領域更適用于現在已經解決的技術。我剛才講人工智能永遠不可能超過人類的能力,但是當他逐步逼近人類能力的時候,其實已經是可以一個一個行業去顛覆掉。比如說人臉識別這種應用,我們今天如果你去機場的話,要過好幾道安檢,又要把身份證拿出來,比對一下,其實人臉識別這個問題解決后,將來到機場就應該大搖大擺就過去了,他那個攝像頭可以識別,不需要一道一道檢查的。我們在家里自己開一個Party,不可能每個人進來先把身份證看一看。但是人多了,幾千人、幾萬人,甚至更多人的情況就要用現在比較笨的辦法一個人一個人對他的身份,但是現在這個問題基本上解決了。比如百度大廈,我們那個閘機就是刷臉可以進,到哪兒直接過就可以了。這還是人臉識別一個東西。語音的識別、自然語言的理解等等,都是可以。未來人和物的交流方式,人和工具交流方式,不是人學習工具怎么使用。人和動物的區別就是人發明了工具,但是人發明了工具之后,是發明人寫一個用戶手冊告訴你這個東西怎么用,電視怎么用、冰箱怎么用,這些東西,電腦手機怎么用,我們要學習用鍵盤,小時候都要學打字。但是未來應該是機器、工具學習人的意圖,以后人再也不需要學習工具怎么用了,我要這個工具干什么,他就能夠明白,這就是我希望用人工智能方法解決理解人的自然語言,以后人和機的對話、人和物的對話就變成一種自然語言的對話,這是未來幾十年可能代表人工智能發展最大的方向。
吳鷹:確實這樣的話,從剛會說話的小孩兒1歲多到很老的老人都可以簡單使用計算機了,這個確實沒有什么太難的。像我母親,她就是老學不會手機怎么用。我就想給她用ipad,最近要給拿弄一個。我想問一問馬化騰,微信,再加上QQ,這是世界最大的社交網絡,里頭有大量的數據。剛才前面發言人都重復講了,大數據是人工智能非常重要的方面。從中國來講,在算法上現在還落后于美國,剛才李彥宏也講了完全超過人類是不可能的。但是我們又講這個大數據這么重要的話,騰訊有沒有可能把你們的關于,當然我覺得微信在很多方面已經超過社交了,現在是生活很重要的一部分,剛才說你去公園買一個2塊錢小孩玩具,微信支付都可以做,你們有沒有可能把數據分享出來,讓創業公司大家來用。
馬化騰:這個問題在內部我們也有激烈討論。首先看人工智能我們關注那幾塊,第一個是場景。第二個是大數據。場景就是你想把這個技術應用在什么場景下,你是不是有高頻的跟用戶接觸,這是一個落地的很重要的地方。所以我們看到很多研究院也好,包括我們內部研發團隊。如果沒有場景落地,沒有平臺支持,基本上就是空中樓閣,研究一半很難往下走。第二個是大數據,大數據也是從平臺、業務部門有大量實際運轉數據才能產生出來。但是這里面很多大數據是垃圾數據,因為沒有標簽,每人做規劃定義,用多好的算法也學不出來,學出來也是走火入魔,沒有用的。數據清洗、標簽化難度非常高,我們甚至要雇傭很多人用人手的辦法,先用人腦清洗干凈,再讓AI學習。這里面是一個混合結合的過程。第三,計算能力,也就是你有云的資源,拿幾十萬核的計算能力,CPU、GPU,我們還是有這個能力的。而且在云里面本身就可以很好的調用,這是我們第三個優勢。第四個,一年前我們比較缺乏的就是人才。通過一年我們也招了挺多的人,我們在微軟、在西雅圖還設置了一個實驗室。因為很多微軟的人不愿意離開西雅圖,所以我們就在旁邊設,沒有辦法,人才就是這樣。幾個方面結合起來才有辦法真正在某一個領域看到它的成效。
我們現在觀察到很多的AI所謂的大拿們,他們更關注怎么落地,能不能把畢生研究成果能夠體現出來,所以在我們內部在吸引人才的時候,往往也會說你們微信、手機QQ里面的平臺數據能不能給他們用,但是事實上大家都知道,BG、部門里面的平臺他們也很希望近水樓臺先得月,數據就在我身邊流動,我為什么不能招人先研究一把,為什么給你呢。我們現在還處在內部怎么把數據分享出來這個階段。當然這里面還有一個用戶很關注的個人隱私,別把我的數據都賣了,到時候大家都知道,這里面還有一個很復雜的信息安全個人隱私脫敏,你是不知道無法根據數據倒推到哪一個人做了什么事情,我們要把這些處理干凈才能往下一步談。這里面數據清理到什么標簽,才能給其他部門、包括外部合作伙伴怎么用。同時有很多數據來自合作伙伴,業界其他公司,他們也遇到這樣的問題那者一堆裸數據不怎么用,這樣業界還要有一個標準,互惠互利交換,這是一個大方向,還有很長的路要走。
吳鷹:大數據清理之后,有針對性的,對業界別人是一個價值,別人也是一個補充。我相信人工智能是一個全社會的協調最后發展的過程。剛才朱民講有那么多問題,所以政府也要介入來做。我們主管部門官員這次也參加了,省政府、市政府官員參加了,就是要大家共同來解決問題,其實還不光是中國,是一個世界范圍內大家協同做一些事情。
微軟如果大家愿意跟你們合作,你們是不是感興趣這個事情?
沈向洋:你剛才問Pony這個問題問的非常好,作為大公司來講,特別是成功大公司來講,我們對社會有一個責任,對行業有一個責任。當我們行業做的很成功,第一件事情就是開研究院。現在Pony也開研究院,唯一做的不對的就是開到微軟門口去了。我也想分享一下在微軟的工作經驗,你說叫這些公司把數據拿出來,讓初創公司或者其他公司去用,我覺得不見得很現實、不見得很容易。Pony剛才解釋的很好。但是我想鼓勵大家,很多的數據如果我們愿意花時間、花精力做一點處理,比如Pony剛才講的。然后讓研究人員去用,完全是可以做到的。我們微軟出了兩個數據集,一個是計算機視覺標準方面的集,這樣可以做數據分割、物體分割。最近做了另外一個數據集是在自然語言,希望有一批新的做問題問答。這樣推動研究領域,大家在標準集下,不斷把標準集數據越做越多。我們做的方法是用搜索引擎數據,非常小心處理過,包括很多隱私的問題等等。拿出一些數據讓大家做研究是非常實際的,完全可以做到。
吳鷹:Pony大家很支持你的觀點,將來我們也期待像BAT這樣的大公司,不但是說數據拿出來分享,剛才Pony還主動提到包括運算能力分享都有可能來做,這樣對創業公司、中小公司,包括政府、研究機構特別是大學,非常重要。其實利潤這個事兒對企業在某些方面是制約企業發展的,他一定要完成這個利潤,他是一個上市公司要做到這些。這就相對的眼光短一點。其實大學很多研究,美國很多一流大學做這些事情,像MIT,今天下午陳剛教授會介紹。他從拿到課題,我要對人類將來有影響。我們這些公司的影響都是很有幫助的。
但是你轉型在智慧城市上鍥而不舍做了6-7年的積累,我剛開始一直打擊他,你跟政府做很多事賺不到錢,你跟政府收多收少都不合適,你們跟人工智能有關的發展上有沒有一個規劃,還是希望跟這些公司合作在人工智能方面的發展?