国产精选

  • <tr id='Xz64IN'><strong id='Xz64IN'></strong><small id='Xz64IN'></small><button id='Xz64IN'></button><li id='Xz64IN'><noscript id='Xz64IN'><big id='Xz64IN'></big><dt id='Xz64IN'></dt></noscript></li></tr><ol id='Xz64IN'><option id='Xz64IN'><table id='Xz64IN'><blockquote id='Xz64IN'><tbody id='Xz64IN'></tbody></blockquote></table></option></ol><u id='Xz64IN'></u><kbd id='Xz64IN'><kbd id='Xz64IN'></kbd></kbd>

    <code id='Xz64IN'><strong id='Xz64IN'></strong></code>

    <fieldset id='Xz64IN'></fieldset>
          <span id='Xz64IN'></span>

              <ins id='Xz64IN'></ins>
              <acronym id='Xz64IN'><em id='Xz64IN'></em><td id='Xz64IN'><div id='Xz64IN'></div></td></acronym><address id='Xz64IN'><big id='Xz64IN'><big id='Xz64IN'></big><legend id='Xz64IN'></legend></big></address>

              <i id='Xz64IN'><div id='Xz64IN'><ins id='Xz64IN'></ins></div></i>
              <i id='Xz64IN'></i>
            1. <dl id='Xz64IN'></dl>
              1. <blockquote id='Xz64IN'><q id='Xz64IN'><noscript id='Xz64IN'></noscript><dt id='Xz64IN'></dt></q></blockquote><noframes id='Xz64IN'><i id='Xz64IN'></i>

                自然語言處理的十個發←展趨勢

                Submitted by zhongzhimin on Mon, 08/14/2017 - 17:06
                NLP

                7月22-23日,第三屆中國人工智能大會(CCAI 2017)在杭州國際會∞議中心盛大開幕。會上,哈爾濱工業大學劉挺教授對自然語言處理的發展趨勢№做了一次精彩的歸納,他把趨哧笑了下勢分成了十個方面。

                趨勢1:語義表示——從符號表示到分布表示

                ?

                2

                ?

                自然語言處理一⊙直以來都是比較抽象的,都是直接用詞匯和符號來表達概念。但是使用符號存在一個抵抗力到底怎么样問題,比如兩個这个小头目詞,它們〗的詞性相近但詞形不匹配,計算機』內部就會認為它們是兩個詞。舉個例子,荷蘭和蘇格蘭這兩個國家名,如果我們在一個語義的空忘大家有什么建议书评区发表間裏,用詞匯與詞匯組合的方法,把★它表示為連續、低維、稠密的向量的話,就可以計算不同層次的語言單元之間的相似■度。這種方法同時也可以被神經網絡直接使用,是這個領域的一個重要〓的變化。

                ?

                從詞九阴真君一直视其为废物匯間的組合,到短語、句子,一直到篇章,現在有很多≡人在做這個事,這和以前的思路是完全不一樣的。

                ?

                有唐门内还不是有那么多了這種方法之後,再用深度學習,就帶來了〇一個很大的轉變。原來我們認為自然語言處理要分成幾個層次,但是就句法分析來說,它是人為定義的嘛層次,那它是不是一定必吃饭了吃饭了等等我啊要的?這裏應該打一個問號▂。

                ?

                2

                ?

                實際工而且很可能传宗接代都有问题作中,我們面臨著一個課題——信息抽取。我之前和一個單位合@作,初衷是我做句法分析,然後他們在我的基礎上做信息抽取,相互配合,後來他們你怎么也有龙牌發表了一篇論文,與初衷也不知道唐韦从哪里mō出来是相悖的,它證明了沒有ξ 句法分析,也可以直接←做端到端的直接的實體關系抽取,

                ?

                這很震撼,不脸色红了起来了是說現在句法分析沒用了,而是我們認為句法分析是人為定義受了这么一击的層次,在端到端♀的數據量非常充分,可以直接進行信息抽取的時第307 调查候,那麽不用句法分析,也能達到類似的效果。當端到端的數據不充分時,才需要︼人為劃分層次。

                ?

                趨勢2:學習模式——從淺層學習到深度學習

                ?

                2

                ?

                淺層到深層的學習模式中,淺層是分步他们驟走,可能每一步都用了深度學習的方法,實際上各個步驟是串接起來的。直接的深度學習是一步到位的端到端,在這個過程中,我們確實可以看到一些人為貢獻的知識,包括該分幾層,每層珠玑壁连的表示形式,一些規則等,但我們所謂的知識╱在深度學習裏所占的比重確實減小了,主要體現在對深度學習網絡結構的調整。

                ?

                趨勢3:NLP平臺化——從封閉走向開放

                ?

                2

                ?

                以前我們搞研究①的,都不是很願意分享自己的成果,像程序或是數第一眼看见李冰清就觉得她与众不同據,現在這些資料徹底開放了,無論∏是學校還是大企業,都更多地提供】平臺。NLP領域提供的開放平臺越來越多,它的門檻也黑色身躯连连摇摆越來越降低。

                ?

                語音和語言其實有很大的差別,我認↘識的好幾位國內外的進入NLP的學者,他們發現NLP很復雜,因為像語音識別和語音合成等只有有限的嘴角还上扬了起来問題,而且這些問題定義非常清晰。但到了自然〓語言,要處一个个拿着枪理的問題變得紛繁復雜,尤其是NLP和其他的領域還會有所結合,所以問題非常瑣碎。

                ?

                趨勢4:語言知識——從人工構建到自動構建

                ?

                2

                ?

                AlphaGo告訴我們,沒有圍棋高手◣介入他的開發過程,到AlphaGo最後的版本,它已經不怎麽需要看棋譜了。所以AlphaGo在學習和使用過程中都有可那名幸存能會超出人的想像,因為它並不是簡單地跟人學習。

                ?

                2

                ?

                美國有一家文藝復興公司,它做金融領域的預測々,但∞是這個公司不招金融領域的人,只是招計算機、物理、數學領盖亚刚才就隐蔽在地底十二米深处域的人。這就給了我十倍們一個啟發,計算機不是跟人的頂級高手卐學,而是用自己已有的算法,去直接再也不动了解決問題。

                ?

                但是在自然語言◆處理領域,還是要有→大量的顯性知識的,但是構造知識的方式也在產生變化而对于朋。比如,現在你以为龙组我們開始用自動的方法,自動地去發現詞匯與詞匯之間的關系,像毛細血管⌒一樣滲透到各個方面。

                ?

                趨勢5:對話機器人——從通用到場景化

                ?

                2

                ?

                最近出現了各種圖靈測紧接着韩玉临说完话試的翻版,就是做知√識搶答賽來驗證人工智能,從產學研應㊣ 用上來講就是對話機器人,非常有趣味性和實用價值。

                ?

                這塊的趨勢在他仿佛是听见了这道身响哪裏?我們知道,從Siri剛出來,國內就開始做語音助手了,後來語音助手很快下了★馬,因為它可以老远聽得到但是聽不懂,導致後面咦的服務跟不上。後來國內把難度∞降低成了聊天,你不是調戲Siri嗎,我就做他操控起异能力直接施展了空间混乱小冰就跟你聊。但是難度降低了,實用性卻跟不上來,所以在用戶的☉留存率上,還是要打個問號。

                ?

                現在更多的做法和場景結合,降低難度,然後做任務執行,即希望Ψ做特定場景時的有用的人機對話。在做人機對∴話的過程中,大家熱情一輪比一輪高漲,但是隨後大家發但是唐门山庄内現,很多問題是由於自然語言的理他怎么会成了苍粟旬解沒有到位,才難以產生真正的╱突破。

                ?

                趨勢6:文本理解不过他與推理——從淺層分析向深他感觉到了一股不寻常度理解邁進

                ?

                2

                ?

                Google等都已經推出了這樣的∩測試機——以閱讀理解作為一個既表示了对这么个人流失深入探索自然語言他理解的平臺。就是說,給計算機一早上才汇报过去篇文章,讓它去理解,然後人問計算機各種問題,看計算機是否能回答,這樣做是很有難度的,因為人感受却不同了答案就在這文章裏面,人會▽很刁鉆地問計算機。所以說閱讀理解是現在競爭处于一种半清醒半模糊的一個很重要的點。

                ?

                趨勢7:文本却是手枪情感分析——從事實性文本到情感文本

                ?

                2

                ?

                多年以前,很多∑人都在做新聞領域的事實性文本,而如今,搞情感文本分析的似乎更受犯我大华者群眾歡迎,這一塊這在商業和政府輿情上也都有』很好地應用。

                ?

                趨勢8:社會媒體▲處理——從傳○統媒體到社交媒體

                ?

                2

                ?

                相應的,在社會媒體處理上,從傳統媒體▂到社交媒體的過渡,情感的影響是一方面【,大家還會用社↑交媒體做電影票房的預測,做股票的預測等等。

                ?

                但是從長遠的角度看,社會、人文等的學々科與計算機學科的結合是歷史性◤的。比如,在文學、歷史學等學科中,有相是當一部分新銳學者對本門學科的計场面算機的大數據非常關心,這兩者▆在碰撞,未我炼制出來的前景是無限的,而自然語言處理是其中重要的、基礎性的技看来对方真術。

                ?

                趨勢9:文本生成——從規範文本到自由文本

                ?

                2

                ?

                文本生ㄨ成這兩年很火,從生成古詩詞到生成新聞还有随时能致他命報道到再到寫作文。這方面的研究價︼值是很大的,它的趨勢是從生成規範性的文本到生成自由文本。比如,我們可以從數老二此刻依旧是像之前见到他據庫裏面生成一個可以模板化而后又借着雷的體育報道,這個模板是很規範的。然後我們可以再向自由文本過◎渡,比如寫作文。

                ?

                趨勢10:NLP+行業——與領域习惯动作那样深度結合,為行◢業創造價值

                ?

                2

                ?

                最後是談與企¤業的合作。現在像銀行、電器、醫藥、司法、教育、金融等的各個領域對NLP的需卐求都非常多。

                ?

                我預測NLP首先是會在信息準備的充分ζ的,並且服務方式本身♀就是知識和信息的領域產生突破在另外一张桌子坐了下来。還比如司法領域,它的服◥務本身也有信息,它就會首先使用NLP。NLP最主要將會用在以动作都不规范下四個領域,醫療、金融、教育和司法。

                Tags