早在100多年前,德國(guó)心理學(xué)家William Stern就推出了IQ測(cè)試,用來測(cè)量人們的智力。從此以后,IQ測(cè)試結(jié)果就成為現(xiàn)代生活中判定孩子學(xué)習(xí)能力以及成年人工作能力的一種標(biāo)準(zhǔn)。
IQ測(cè)試通常包括三類問題,即邏輯問題(如圖形推理)、數(shù)學(xué)問題(如發(fā)現(xiàn)數(shù)列規(guī)律)以及文字推理類問題,這些問題都是基于類比、分類、同義詞或反義詞設(shè)置。
正是文字推理類問題吸引了中國(guó)科技大學(xué)的王華正(Huazheng Wang)等以及北京微軟研究院的高斌等研究人員。電腦向來不擅長(zhǎng)文字推理類問題,在一個(gè)自然語言處理機(jī)器里輸入文字推理類問題,機(jī)器的表現(xiàn)會(huì)很糟糕,甚至與一般人的能力相比都相距甚遠(yuǎn)。
而現(xiàn)在,這一切都在發(fā)生著改變。研究人員研發(fā)的深度學(xué)習(xí)機(jī)器在處理文字類推理問題方面的能力已經(jīng)首次超過了一般人。
最近幾年,電腦科學(xué)家通過使用數(shù)據(jù)挖掘技術(shù)分析巨大的文本語料庫,以發(fā)現(xiàn)語料之間的聯(lián)系。這尤其給王華正等科學(xué)家統(tǒng)計(jì)單詞出現(xiàn)模式帶來了極大的便利,比如某個(gè)特定的詞在其他詞前后出現(xiàn)的頻率。這就使得在巨大的參數(shù)空間里,理清單詞之間的關(guān)系成為了可能。
這樣,在這個(gè)高緯度空間里就可以將單詞看做一個(gè)個(gè)向量,像其他向量一樣,可以使用比較、增值以及減值等數(shù)學(xué)方法進(jìn)行處理。這樣就會(huì)得到諸如下面的向量關(guān)系:國(guó)王—男人+女人=女王。
這個(gè)方法現(xiàn)在已經(jīng)取得重大成功。谷歌假設(shè)相近向量代表的不同語言詞序列在意思上是對(duì)等的,實(shí)現(xiàn)了語言自動(dòng)翻譯。
但是,這種方法有一個(gè)顯著的缺陷,即假設(shè)中,每個(gè)單詞的含義均由單一向量指代,因此單詞的含義也是單一的。而文字測(cè)試傾向于使用多義詞增加問題的難度。
王華正等人通過查找單詞在語料庫中的常見搭配解決了這一問題。接下來他們運(yùn)用運(yùn)算法則觀察這些單詞的分布。最后通過詞典查出單詞的不同含義,并將這些不同含義與不同分布的同一單詞對(duì)應(yīng)聯(lián)系起來。
小編推薦閱讀機(jī)器學(xué)習(xí):神經(jīng)網(wǎng)絡(luò)構(gòu)建(下)
閱讀華為Mate品牌盛典:HarmonyOS NEXT加持下游戲性能得到充分釋放
閱讀實(shí)現(xiàn)對(duì)象集合與DataTable的相互轉(zhuǎn)換
閱讀鴻蒙NEXT元服務(wù):論如何免費(fèi)快速上架作品
閱讀算法與數(shù)據(jù)結(jié)構(gòu) 1 - 模擬
閱讀5. Spring Cloud OpenFeign 聲明式 WebService 客戶端的超詳細(xì)使用
閱讀Java代理模式:靜態(tài)代理和動(dòng)態(tài)代理的對(duì)比分析
閱讀Win11筆記本“自動(dòng)管理應(yīng)用的顏色”顯示規(guī)則
閱讀本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請(qǐng)發(fā)郵件[email protected]
湘ICP備2022002427號(hào)-10 湘公網(wǎng)安備:43070202000427號(hào)© 2013~2025 haote.com 好特網(wǎng)