CCAI 2019|周志華:人工智能是個(gè)高度凸顯“個(gè)人英雄主義”的行業(yè)11
2019年中國人工智能大會(huì)(Chinese Congress on Artificial Intelligence 2019,簡稱“CCAI 2019”)將于在9月21日-22日在青島膠州召開。 周志華教授是大會(huì)程序委員會(huì)主席之一。他從事人工智能研究20多年,研究領(lǐng)域包括人工智能、機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘等,是國內(nèi)人工智能研究的代表人物。周志華教授目前擔(dān)任南京大學(xué)人工智能學(xué)院院長,是人工智能相關(guān)五大主流國際學(xué)會(huì)的首位華人“大滿貫”Fellow,還是歐洲科學(xué)院外籍院士。 近年來以深度學(xué)習(xí)為代表的人工智能取得了令人矚目的發(fā)展,周志華作為該領(lǐng)域的***專家,有著怎樣的觀察和思考,又提出過什么樣的學(xué)科洞見?讓我們一起看看。 深度學(xué)習(xí)成功的三個(gè)秘訣近年來人工智能的火熱,離不開深度學(xué)習(xí)的幾次突破,其中尤以圍棋智能AlphaGo的橫空出世為甚。它以壓倒性優(yōu)勢先后橫掃人類兩大頂尖棋手李世石與柯潔,在收獲一片驚呼與贊嘆的同時(shí),引發(fā)了人們對(duì)人工智能的能力邊界,以及未來生活種種可能性的無限想象。 作為機(jī)器學(xué)習(xí)領(lǐng)域的***專家,周志華對(duì)技術(shù)的發(fā)展始終保持高度理性和清醒認(rèn)知。他將當(dāng)前機(jī)器學(xué)習(xí)的成功歸于這三個(gè)因素:有效的深度模型、強(qiáng)監(jiān)督信息以及穩(wěn)定的學(xué)習(xí)環(huán)境。 有效的深度模型,在現(xiàn)階段基本上就是深度神經(jīng)網(wǎng)絡(luò)。曾有人提出,神經(jīng)網(wǎng)絡(luò)不是新事物,早在半個(gè)世紀(jì)之前就有了,今天我們之所以能夠做更深的神經(jīng)網(wǎng)絡(luò),只不過是因?yàn)橛?jì)算能力強(qiáng),現(xiàn)在能夠訓(xùn)練了。 周志華認(rèn)為,這是一個(gè)認(rèn)識(shí)誤區(qū)。他指出,2006年之前學(xué)界并不知道如何訓(xùn)練出五層以上的神經(jīng)網(wǎng)絡(luò),這不是由于計(jì)算能力約束,而是不知道如何設(shè)計(jì)有效的算法。圖靈獎(jiǎng)得主杰夫辛頓在這方面做出了重要貢獻(xiàn),使得訓(xùn)練更深的神經(jīng)網(wǎng)絡(luò)成為可能,這才有了后來深度學(xué)習(xí)的發(fā)展和繁榮。 第二個(gè)因素是存在強(qiáng)監(jiān)督的信息。深度學(xué)習(xí)需要大量的樣本,那么在今天這個(gè)大數(shù)據(jù)時(shí)代,樣本是不是不成問題? 周志華解釋說,不是的。僅有樣本并不夠,重要的是這些樣本需要有標(biāo)記,這將耗費(fèi)大量的人力物力,機(jī)器學(xué)習(xí)技術(shù)對(duì)強(qiáng)監(jiān)督信息是高度依賴的。 以AlphaGo為例,它使用人類職業(yè)六段以上的超過16萬棋局進(jìn)行訓(xùn)練,后來發(fā)明的AlphaZero不使用人類棋局,通過兩個(gè)程序直接對(duì)弈來實(shí)現(xiàn)性能的提升,但這種模式同樣依賴于強(qiáng)監(jiān)督信息,因?yàn)樗蕾囉谌祟愄峁┑膭儇?fù)判斷規(guī)則,而這個(gè)勝負(fù)規(guī)則本身就是一般應(yīng)用任務(wù)里很難具備的非常強(qiáng)的監(jiān)督信息。 穩(wěn)定的學(xué)習(xí)環(huán)境對(duì)當(dāng)前機(jī)器學(xué)習(xí)技術(shù)的成功同樣不可或缺。在這樣的環(huán)境中,學(xué)習(xí)過程涉及的數(shù)據(jù)分布、樣本空間、學(xué)習(xí)目標(biāo)都是固定的。 深度學(xué)習(xí)如何實(shí)現(xiàn)突破?在周志華看來,任何一個(gè)模型都必然存在缺陷,深度神經(jīng)網(wǎng)絡(luò)也是。**,它要求人們花費(fèi)大量的精力調(diào)整參數(shù);第二,現(xiàn)在使用的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)模型需要在訓(xùn)練前預(yù)先確定,但事實(shí)上,在解決一個(gè)現(xiàn)實(shí)問題之前人們并不知道什么樣復(fù)雜度的模型是最恰當(dāng)?shù)?。此外,?duì)大訓(xùn)練數(shù)據(jù)的依賴、理論分析的困難、模型的黑箱性等等都不容忽視。 周志華指出,機(jī)器學(xué)習(xí)領(lǐng)域“沒有免費(fèi)的午餐定理”說明,不存在“包打天下”的模型,任何一個(gè)模型可能只有一部分任務(wù)是適用的??梢钥吹缴疃壬窠?jīng)網(wǎng)絡(luò)主要是在圖像、聲音等數(shù)值建模任務(wù)上性能**,但在涉及符號(hào)建模、離散建模、混合建模等的其他任務(wù)上并不突出,因此,有必要針對(duì)這樣的任務(wù)特點(diǎn)來考慮設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)模型之外的新型深度學(xué)習(xí)模型。 其次,當(dāng)前的深度學(xué)習(xí)高度依賴于強(qiáng)監(jiān)督信息,可是把現(xiàn)實(shí)生活中強(qiáng)監(jiān)督樣本需要付出巨大的代價(jià),如何利用弱監(jiān)督信息進(jìn)行學(xué)習(xí)是重要研究方向。 最后,現(xiàn)在越來越多碰見的是開放動(dòng)態(tài)環(huán)境,學(xué)習(xí)過程涉及的因素都可能發(fā)生變化。這對(duì)機(jī)器學(xué)習(xí)提出了更大的挑戰(zhàn)。 因此周志華總結(jié)道,未來機(jī)器學(xué)習(xí)研究需要多關(guān)注:
人工智能的人才培養(yǎng)周志華坦言,從對(duì)人工智能學(xué)科的歷史貢獻(xiàn)來看,中國不僅比不上美國,也不及歐洲、日本。國際上五六十年代就開始了人工智能研究,而我國在1978年以后才恢復(fù)科學(xué)研究,起步太晚,人工智能研究在新世紀(jì)以來才開始與國際接軌。 他同時(shí)表示,近十年來中國人工智能取得了高速發(fā)展,如果僅從最近幾年的發(fā)展情況來看,確實(shí)可以說目前中國在人工智能領(lǐng)域僅次于美國。 2018年,國內(nèi)C9高校的首個(gè)人工智能學(xué)院在南京大學(xué)成立,周志華為首任院長。到2019年3月,已有35所高校獲得首批建設(shè)人工智能本科專業(yè)的資格。 周志華認(rèn)為,人工智能學(xué)院的涌現(xiàn),是政策推動(dòng)、產(chǎn)業(yè)發(fā)展、學(xué)科內(nèi)涵多方共同作用的結(jié)果:首先,人工智能是時(shí)代關(guān)注的焦點(diǎn),國家政府高度重視;第二,人工智能技術(shù)已經(jīng)進(jìn)入互聯(lián)網(wǎng)、金融、智能制造等諸多行業(yè),人才缺口非常大;第三,人工智能并不是一個(gè)短期熱點(diǎn),而是一個(gè)經(jīng)過60多年發(fā)展的嚴(yán)肅學(xué)科,已經(jīng)形成了龐大自洽的專業(yè)知識(shí)體系,全面掌握人工智能專業(yè)知識(shí)需要付出大量的學(xué)習(xí)時(shí)間和精力。 在人才發(fā)展方面,周志華提出,人工智能是個(gè)高度凸顯“個(gè)人英雄主義”的行業(yè)。因?yàn)橐酝鶎?duì)人才培養(yǎng)來說,從“學(xué)”到“用”之間的間隔是天然存在的。以軟件開發(fā)為例,現(xiàn)在幾乎沒有什么軟件能夠僅靠1、2個(gè)人完成,必須通過大團(tuán)隊(duì)合作,而學(xué)校主要是培養(yǎng)學(xué)生的個(gè)人素質(zhì)能力,例如一門課考試不可能讓幾十個(gè)學(xué)生做同一張?jiān)嚲砣缓笸淼梅郑?學(xué)生在大團(tuán)隊(duì)中開展工作的能力必然要到企業(yè)才能培養(yǎng)發(fā)展。而人工智能行業(yè)則有所不同,它的“學(xué)以致用”性非常強(qiáng),從高校培養(yǎng)出來的高水平人才可以很快在產(chǎn)業(yè)界發(fā)揮作用,周志華領(lǐng)導(dǎo)的LAMDA(南京大學(xué)機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘研究所)培養(yǎng)畢業(yè)的學(xué)生加入阿里、騰訊、華為很快就為公司取得重要突破性業(yè)績,多名博士生甚至在讀期間就被聘為知名企業(yè)研究院院長,就是明顯的例子。周志華指出,人工智能領(lǐng)域從實(shí)驗(yàn)室成果到產(chǎn)業(yè)界應(yīng)用的“路徑”相當(dāng)短,實(shí)驗(yàn)室里由于個(gè)別“聰明人”取得的算法突破往往很快就可以在產(chǎn)業(yè)應(yīng)用中實(shí)施,甚至推進(jìn)引領(lǐng)整個(gè)領(lǐng)域的技術(shù)發(fā)展。為了在人工智能時(shí)代加快我國科技和產(chǎn)業(yè)發(fā)展,高校在培養(yǎng)高水平人工智能人才方面可以多下功夫爭取做更大貢獻(xiàn)。 |