當(dāng)前位置: 首頁 » 行業(yè)資訊 » 專題 » 人工智能 » 正文

古文字研究也用上了人工智能?

放大字體  縮小字體 發(fā)布日期:2022-10-31  來源:光明日報  瀏覽次數(shù):570
核心提示:人工智能已經(jīng)參與到人們的生活、工作、學(xué)習(xí)等諸多方面,科研工作同樣如此。古文字專業(yè)雖然屬于傳統(tǒng)學(xué)科,卻與人工智能技術(shù)十分契

人工智能已經(jīng)參與到人們的生活、工作、學(xué)習(xí)等諸多方面,科研工作同樣如此。古文字專業(yè)雖然屬于傳統(tǒng)學(xué)科,卻與人工智能技術(shù)十分契合。相較于人文學(xué)科中的許多專業(yè),古文字考釋更為客觀,其研究結(jié)論具有唯一性,研究過程也遵循一定的規(guī)律,在人文學(xué)科中最接近自然科學(xué),這符合人工智能技術(shù)的工作原理。

古文字研究也用上了人工智能?

(古文字形體系聯(lián)圖譜)

那么,人工智能的哪些技術(shù)能夠輔助古文字研究?之前需要人力完成什么工作?學(xué)界目前又做到了什么程度?本文便擬談?wù)勥@些內(nèi)容。

就古文字考釋而言,人工智能可以提供的幫助是多方面的。著名古文字學(xué)家唐蘭先生曾將古文字的考釋方法總結(jié)為形體對照法、推勘法、偏旁分析法與歷史考證法。人工智能中的圖像識別、自然語言處理、知識圖譜等技術(shù)正可與這幾種方法相互對應(yīng)。

形體對照法是把不同材料中的古文字形體加以比較、對照,利用已識字來考證未釋形體。這種方法需要研究者能夠熟記大量古文字形體,如此才能把不同材料聯(lián)系起來。而人工智能識別利用的是深度學(xué)習(xí)與計算機(jī)視覺技術(shù)和算法,只要提供足夠多的古文字形體來訓(xùn)練模型,就能實(shí)現(xiàn)識別功能。記憶方面,數(shù)以百萬計的文字形體總量,人腦只能記住其中很小的一部分,而智能模型卻可以全面覆蓋,能力更為強(qiáng)大,識別推薦結(jié)果會給專家以有效提示。

推勘法是將出土材料與文獻(xiàn)中的記載進(jìn)行對勘,尋繹文義,進(jìn)而破解未釋形體。隨著深度學(xué)習(xí)技術(shù)的使用,尤其是2018年谷歌公司開發(fā)的BERT預(yù)訓(xùn)練模型在自然語言處理領(lǐng)域的大規(guī)模使用,近年來,自然語言信息處理技術(shù)發(fā)展迅速,在命名實(shí)體識別、語義關(guān)系等方面有重大提升。經(jīng)過足夠的數(shù)據(jù)訓(xùn)練,模型能夠具有普通人甚至專家一般的能力。

舉一個通俗易懂的例子,假設(shè)“過節(jié)了我們煮△▽吃”一句中的“△▽”二形是未釋字或殘損字。如果要考證這兩個形體,經(jīng)過訓(xùn)練的深度學(xué)習(xí)模型可以給出備選答案,如“餃子”“湯圓”“粽子”等相符合的詞語。因為有“過節(jié)”限定,所以“白粥”等普通熬煮食物不會被推薦;因為有“煮”字限定,“月餅”等非熬煮食品不會被推薦。深度學(xué)習(xí)模型完全能夠捕捉語句里面關(guān)鍵字詞的文意。

對于例子中的這句話,普通人也能給出正確的判斷方向。但是如果面對的是古文字材料,情況就不同了,因為多數(shù)人對古代漢語并不熟悉,即使專業(yè)學(xué)者也無法熟記大量的古代語料。所以,我們可以利用出土文獻(xiàn)的釋文數(shù)據(jù)和傳世古書的記載來訓(xùn)練語言模型,從而在研究過程中利用模型圈定待釋字的目標(biāo)范圍,有時甚至能夠鎖定正確答案,這能給予專家極大的幫助。

偏旁分析法是通過分析、識別偏旁來考釋古文字。歷史考證法是根據(jù)不同時期形體的特征及演變規(guī)律來考釋古文字。人工智能知識圖譜技術(shù)與這兩種方法相關(guān)。知識圖譜是描繪實(shí)體之間關(guān)系的智能網(wǎng)絡(luò),能夠整合部件、字形、詞義幾個層次的古文字知識?梢愿鶕(jù)文字偏旁系聯(lián)圖譜,從而展示出那些具有相同偏旁的文字及對應(yīng)形體;知識圖譜也具有挖掘文字演變規(guī)律的潛力,進(jìn)而為專家提供幫助?梢,在古文字研究過程中,人工智能技術(shù)可以從多個維度為專家提供輔助。

當(dāng)然,隨著戰(zhàn)國竹簡的公布,古文字的考釋方法也發(fā)生了變化,通過破解通假關(guān)系找到文字所代表的“詞”顯得尤為重要。這就需要專家做好通假現(xiàn)象標(biāo)注,經(jīng)過反復(fù)訓(xùn)練使模型具有通假語感。但是面對以往從未出現(xiàn)過的通假用例,模型是無能為力的,所以還需要音韻學(xué)家介入,從通假規(guī)律等角度進(jìn)行研究,讓模型同時掌握通假條件所需要的“實(shí)例”和“規(guī)律”。

筆者認(rèn)為,人工智能與古文字結(jié)合可分成三個階段:第一階段是人工塑造模型。古文字專家需要整理基礎(chǔ)數(shù)據(jù),包括資料釋文、圖版切字、字形拆分、屬性標(biāo)注等等;計算機(jī)專家利用這些數(shù)據(jù)完成功能實(shí)現(xiàn)。這一階段費(fèi)時費(fèi)力,最為艱苦。第二階段是人工智能利用已經(jīng)實(shí)現(xiàn)的技術(shù)為專家提供輔助。這有可能是省時省力的資料對勘,有可能是思考方向的積極引導(dǎo),也有可能是研究結(jié)果的智能推薦。此階段專家也會針對智能技術(shù)的不足進(jìn)行完善。第三個階段就是人工智能的獨(dú)立判斷,它可以綜合以上所有方面給出問題的答案。目前在這一領(lǐng)域的研究,學(xué)界似乎尚處在第一階段。

以上重點(diǎn)談了人工智能與古文字考釋的關(guān)系。事實(shí)上,人工智能在其他方面也能給研究者提供幫助,如甲骨綴合、甲骨文分組分類、青銅器斷代、竹簡編聯(lián)等等?梢灶A(yù)見,將來人工智能技術(shù)會在更多方面為古文字研究提供幫助。人們常說,古文字學(xué)是一門古老而又年輕的學(xué)問。由于人工智能技術(shù)的介入,古文字學(xué)的“年輕”也體現(xiàn)在研究的方法上,可以與最新的科技相互結(jié)合。相信新的研究資料與新的研究方法能讓古文字學(xué)一直年輕且充滿活力。

(李春桃 文/圖 作者系吉林大學(xué)考古學(xué)院古籍研究所教授 來源 光明日報)

 
工博士智能制造網(wǎng)凡資訊來源注明為其他媒體來源的信息,均為轉(zhuǎn)載自其他媒體,并不代表本網(wǎng)站贊同其觀點(diǎn),也不代表本網(wǎng)站對其真實(shí)性負(fù)責(zé)。您若對該文章內(nèi)容有任何疑問或質(zhì)疑,請立即與我們聯(lián)系,本網(wǎng)站將迅速給您回應(yīng)并做處理。
聯(lián)系電話:021-31666777
新聞、技術(shù)文章投稿QQ:3267146135  投稿郵箱:syy@gongboshi.com
關(guān)鍵詞: 古文字 人工智能
 
[ 行業(yè)資訊搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 違規(guī)舉報 ]  [ 關(guān)閉窗口 ]

 

 
推薦圖文
推薦行業(yè)資訊
點(diǎn)擊排行
 
首頁 | 店鋪 | 產(chǎn)品中心 | 工博士培訓(xùn) | 資料下載 | 方案案例 | 機(jī)器人選型 | 會員注冊 | 關(guān)于我們 | 聲明 | 合作客戶 | 聯(lián)系方式 | 網(wǎng)站留言| 網(wǎng)站地圖

咨詢電話

021-80392549

企業(yè)微信

主站蜘蛛池模板: 国产亚洲欧洲Aⅴ综合一区| 天天看天天摸色天天综合网| 色欲人妻综合AAAAA网| 亚洲色偷偷狠狠综合网| 亚洲国产成人久久综合野外| 婷婷激情综合网| 一本一道久久a久久精品综合| 亚洲国产aⅴ综合网| 一本久久a久久精品综合香蕉| 伊人久久大香线焦综合四虎| 国产成人无码综合亚洲日韩| 欧美久久综合性欧美| 亚洲综合国产精品| 婷婷久久综合九色综合九七| 欧美日韩综合一区在线观看| 综合五月激情五月开心婷婷| 一本久久a久久精品vr综合| 久久狠狠色狠狠色综合| 在线综合亚洲欧美日韩| 国产色婷婷五月精品综合在线| 狠狠色综合久久久久尤物| 91精品欧美综合在线观看| 久久91精品综合国产首页| 狠狠色噜噜狠狠狠狠色综合久AV | 久久亚洲综合色一区二区三区| 色综合天天综合网国产成人网| 久久久久噜噜噜亚洲熟女综合| 国产综合内射日韩久| 亚洲狠狠爱综合影院婷婷| 狠狠狠色丁香婷婷综合久久五月| 国产香蕉久久精品综合网| 亚洲成a人v欧美综合天堂| 久久久久青草线蕉综合超碰| 伊人yinren6综合网色狠狠| 亚洲国产精品综合久久一线| 国产激情综合在线观看| 狠狠色狠狠色综合系列| 欧美成人精品一区二区综合| 亚洲 综合 国产 欧洲 丝袜| 国产成人综合网在线观看| 综合国产在线观看无码|