新京報(bào)訊(記者楊菲菲)12月16日,在北京大學(xué)語言學(xué)實(shí)驗(yàn)室成立100周年之際,中華民族語言文字接觸交融大數(shù)據(jù)模型正式發(fā)布,有聲博物館項(xiàng)目也正式啟動(dòng)建設(shè)。


“語言是一個(gè)社會(huì)性的行為,它和社會(huì)形態(tài)的發(fā)展密切相關(guān)。現(xiàn)在我們提出來中華民族語言共同體意識(shí),語言是一個(gè)非常重要的基礎(chǔ)?!北本┐髮W(xué)語言學(xué)實(shí)驗(yàn)室主任、中文系教授孔江平表示,團(tuán)隊(duì)在田野調(diào)查中對120個(gè)語言點(diǎn)進(jìn)行了語言基本信息、文字活力、語言活力、語言詞匯演化、語言認(rèn)同等多項(xiàng)調(diào)查。


北京大學(xué)語言學(xué)實(shí)驗(yàn)室主任、中文系教授孔江平在現(xiàn)場進(jìn)行分享。新京報(bào)記者 李木易 攝


據(jù)悉,2021年12月,北京大學(xué)語言學(xué)實(shí)驗(yàn)室獲批教育部哲學(xué)社會(huì)科學(xué)實(shí)驗(yàn)室,在教育部經(jīng)費(fèi)的支持下,北京大學(xué)語言學(xué)實(shí)驗(yàn)室于2022年春啟動(dòng)了“中華民族語言文字接觸交融大數(shù)據(jù)模型建設(shè)“項(xiàng)目。項(xiàng)目組織國內(nèi)12所大學(xué)和科研機(jī)構(gòu)的約20名專家的研究團(tuán)隊(duì),近200名博士生和研究生,對中華民族語言文字接觸交融進(jìn)行了大規(guī)模的田野調(diào)查,歷經(jīng)四年,初步完成了基礎(chǔ)的調(diào)查工作和大型數(shù)據(jù)庫建設(shè)。


調(diào)查發(fā)現(xiàn),與人們普遍認(rèn)知的“要么說普通話,要么說民族語言”不同,民族語言正在不斷融入國家的通用語言??捉浇忉專Z言是人類文明的基石,也是思維的工具、文化的載體,在公共社會(huì)場合,漢語普通話的使用在不斷增加;家庭依然是民族語言的使用高地。


同時(shí),研究團(tuán)隊(duì)還開展了基于有聲文化的中華民族共同體意識(shí)研究??捉浇忉?,團(tuán)隊(duì)采用人工智能的方法,建設(shè)基于演化的中華民族有聲文化大型數(shù)據(jù)庫,建設(shè)中華民族優(yōu)秀有聲文化“基因庫”,構(gòu)建利于了解研究中華民族情感認(rèn)同的大數(shù)據(jù)模型。


此外,孔江平團(tuán)隊(duì)也借助中華民族語言文字接觸交融大數(shù)據(jù)模型對語言學(xué)基礎(chǔ)研究有了更多的探索。


“語言的產(chǎn)生,特別是聲音的出現(xiàn),一直是國際語言學(xué)研究的難題。”孔江平表示,鑒于現(xiàn)在有頭蓋骨和下頜骨的古人類化石數(shù)量和年代受限,并不能構(gòu)建出人類聲音的完整演化過程。孔江平團(tuán)隊(duì)將黑猩猩的聲道和人類的聲道進(jìn)行擬合,并合成聲音,致力于發(fā)現(xiàn)人類語音的涌現(xiàn)規(guī)律。


讓沉睡在田野中的、即將消亡的聲音活起來、傳承下去,中華民族語言文字接觸交融大數(shù)據(jù)模型將發(fā)揮重要作用。


孔江平介紹,目前國家已經(jīng)開展了多期“語?!惫こ?,記錄了大量語言文字,也有很多珍貴的資料,但在工業(yè)革命時(shí)期人類往城市遷徙以后,很多語言的生態(tài)消失了,很難找到將語言保留下來的方法。大模型的出現(xiàn)給語言保護(hù)提供了新的可能?!拔覀儸F(xiàn)在嘗試做了一個(gè)機(jī)器翻譯系統(tǒng)和一個(gè)語言合成系統(tǒng),從理論上來講,哪怕一種語言消失了,我們只要給出相應(yīng)的漢語,那系統(tǒng)就會(huì)自動(dòng)生成對應(yīng)的語言。”


北京大學(xué)語言學(xué)實(shí)驗(yàn)室成立一百周年系列活動(dòng)啟動(dòng),有聲博物館項(xiàng)目建設(shè)同步啟動(dòng)。新京報(bào)記者 李木易 攝


當(dāng)天,有聲博物館項(xiàng)目也在北大啟動(dòng)。根據(jù)規(guī)劃,有聲博物館未來將設(shè)置歷史分館、現(xiàn)代社會(huì)分館、自然分館、動(dòng)物分館、聲律分館、格律分館、曲律分館、樂律分館、語言障礙分館等。


資料顯示,北京大學(xué)語言實(shí)驗(yàn)室前身是“北京大學(xué)語音樂律實(shí)驗(yàn)室”,創(chuàng)辦于1925年,創(chuàng)始人為劉復(fù)(字半農(nóng))。這是中國成立最早的語音學(xué)實(shí)驗(yàn)室,是北大人文歷史的重要篇章,也標(biāo)志著中國現(xiàn)代語音學(xué)研究的開端。


編輯 繆晨霞

校對 柳寶慶