網(wǎng)友評(píng)分:
9.7分
貴鶴語料管理與檢索助手支持單關(guān)鍵詞和語法組合結(jié)構(gòu)查詢的語料管理和檢索工具。支持語料庫自建管理, 并可用以提取文獻(xiàn)中的語句,可將對(duì)話和敘述語句分別提取,適合漢語語法研究人員使用。
語料庫是語料庫語言學(xué)研究的基礎(chǔ)資源,也是經(jīng)驗(yàn)主義語言研究方法的主要資源。應(yīng)用于詞典編纂,語言教學(xué),傳統(tǒng)語言研究,自然語言處理中基于統(tǒng)計(jì)或?qū)嵗难芯康确矫妗?/p>
?、闭Z料庫中存放的是在語言的實(shí)際使用中真實(shí)出現(xiàn)過的語言材料,因此例句庫通常不應(yīng)算作語料庫;
⒉語料庫是承載語言知識(shí)的基礎(chǔ)資源,但并不等于語言知識(shí);
⒊真實(shí)語料需要經(jīng)過加工(分析和處理),才能成為有用的資源。
一、語料管理
所有語料均存放于程序目錄corpus文件夾中。
1、加入語料
可通過兩種方式加入語料:一是直接復(fù)制語料(TXT文檔)到corpus文件夾中,二是通過軟件界面“加入語料”按鈕進(jìn)入加入語料操作界面進(jìn)行操作。
2、刪除語料
為確保不誤刪語料,軟件界面上不提供刪除語料的操作功能,只能從程序目錄corpus文件夾中進(jìn)行操作。
3、語料分類分級(jí)
在corpus文件夾根據(jù)語料類別建立新文件夾,以語料類別名稱命名,即可建立一個(gè)語料類別。每個(gè)文件夾下的文件夾都算一個(gè)子類。比如建立一個(gè)“北方話”的文件夾,該文件夾下又可建立“東北話”、“西北話”、“北京話”等子文件夾,每個(gè)子文件夾下放入相應(yīng)的語料TXT文檔,軟件運(yùn)行后,即可在軟件右側(cè)文獻(xiàn)列表中看到相應(yīng)的樹形目錄。
二、語料檢索
語料查詢時(shí),一定要先在文獻(xiàn)列表中選中相應(yīng)的文獻(xiàn)。可以一次選擇多篇文獻(xiàn)后進(jìn)行檢索。
1、單個(gè)關(guān)鍵詞檢索
在關(guān)鍵詞輸入框中輸入一個(gè)關(guān)鍵詞,設(shè)置好左右顯示字?jǐn)?shù)(即關(guān)鍵詞左右兩側(cè)的字?jǐn)?shù)),點(diǎn)“搜索”按鈕,就可以搜索到所選文獻(xiàn)中含關(guān)鍵詞的語句并顯示到搜索提取語句列表中。
2、雙關(guān)鍵詞組合檢索
在關(guān)鍵詞輸入框中輸入兩個(gè)關(guān)鍵詞,兩詞之間以一個(gè)空格符號(hào)間隔,右側(cè)設(shè)置關(guān)鍵詞的配合模式(1、兩關(guān)鍵詞間隔字符數(shù);2、第二詞在第一詞之后的多少字符范圍內(nèi)),點(diǎn)“搜索”按鈕,即可檢索出符合兩關(guān)鍵詞配合特點(diǎn)的語句并提取顯示出來。
三、文獻(xiàn)語句提取
1、提取對(duì)話句:選中文獻(xiàn),點(diǎn)“提取對(duì)話句”按鈕,會(huì)將文獻(xiàn)中引號(hào)內(nèi)的對(duì)話語句提出出來以供進(jìn)一上使用。
2、提取敘述句:選中文獻(xiàn),點(diǎn)“提取對(duì)話句”按鈕,會(huì)將文獻(xiàn)中對(duì)話之外的敘述句提取出來以供進(jìn)一步使用。
3、提取所有語句:不區(qū)分對(duì)話和敘述類別,以漢語常用的斷句標(biāo)點(diǎn)作標(biāo)記,按順序逐句提取所有語句。由于是單線程方式提取,速度比較慢。字?jǐn)?shù)較多的文獻(xiàn)花的時(shí)間可能較多。
標(biāo)簽: 文獻(xiàn)檢索 語法學(xué)習(xí)
關(guān)于本站|下載幫助|下載聲明|軟件發(fā)布|聯(lián)系我們
Copyright ? 2005-2024 m.daaijiaoyu.cn.All rights reserved.
浙ICP備2024132706號(hào)-1 浙公網(wǎng)安備33038102330474號(hào)