中新社南京9月11日電 (盛捷)從社會各界遴選的425名發(fā)音人講方言和地方普通話,語音時長超320小時、數(shù)據(jù)容量超830GB,工程耗時五年……江蘇省教育廳語工處處長趙曉群11日在此間透露,江蘇語言資料有聲數(shù)據(jù)庫已建成,這是中國第一個語言資料庫。
2008年起,中國有6個省份陸續(xù)開展語言資料庫建設。作為中國國家語言文字工作委員會指定試點省份,江蘇省轄內(nèi)三大方言區(qū)設立了70個調(diào)查點:江淮官話41個,吳方言19個,中原官話10個。
“這五年的采錄中最困難的事情莫過于發(fā)音人的遴選。”趙曉群感慨,每一個觀察點要選老年男子、青年男子、老年女子、青年女子4個方言發(fā)音,對他們的出生年月、文化程度、是否離開過這個地方等細節(jié)都有非常明確的規(guī)定。
“雖然有很多市區(qū)遴選時民眾報名踴躍,但有很多地方,特別是縣一級找不到發(fā)音人。即使我們做了大量宣傳,有時候一個縣設兩個點,也找不到發(fā)音人。”趙曉群說。
江蘇這樣解決“找人”難題:從縣里到鄉(xiāng)鎮(zhèn),通過鄉(xiāng)鎮(zhèn)老師進行聯(lián)系,老師們騎著自行車挨村串戶,或到當?shù)嘏沙鏊檫@個人后來搬到何處,然后去找他。
江蘇省自行研制的“江蘇語言與文化資料庫”共收錄了三方面的資源,包括江蘇語言資料有聲數(shù)據(jù)庫的調(diào)查內(nèi)容、方言和地方普通話有聲數(shù)據(jù),江蘇省規(guī)劃并采錄的地方戲曲、民歌童謠、諺語叫賣等方言口頭文化有聲資料,以及針對江蘇人語言學習而開發(fā)的多媒體視頻資料等。(原標題:425名江蘇發(fā)音人在中國首個語言文化資源庫講方言)