《“面向汉语国际教育的词语搭配知识库”帮助文档.docx》由会员分享,可在线阅读,更多相关《“面向汉语国际教育的词语搭配知识库”帮助文档.docx(2页珍藏版)》请在课桌文档上搜索。
1、“面向汉语国际教育的词语搭配知识库”帮助文档1知识库简介本知识库收录了形形搭配、形名搭配、形动搭配、名形搭配、名名搭配、名动搭配、动形搭配、动名搭配、动动搭配等9种类型的实词搭配资源,基于HSK词表对搭配数据进行筛选,确立了31003种词条的搭配资源。2疑义术语释义在知识库中,ID表示序号,W表示搭配词语;P表示数字对应的搭配词语的词性;L表示其后数字对应的搭配词语的HSK等级;ST表示搭配的语法结构;LJ表示邻接属性;F表示搭配的出现频次;Ml表示两个搭配词之间的互信息;T表示搭配的翻译;TD表示构成对译的翻译编号;PLT表示推荐教学等级,首位数字表示学生学习该搭配应当具有或正在学习的词汇水
2、平;第二位的字母H表示高频搭配,L表示低频搭配,高频搭配推荐优先教学;第三位数字表示翻译难度,指示了搭配的习得难度;S表示例句。(1) ID:数据库中的序号。(2) W:搭配词语,其后用数字区分先后顺序。(3) P:其后数字对应的搭配词语的词性。(4) 1.:其后数字对应的搭配词语的HSK等级。(5) ST:搭配的语法结构;(6) 1.J:搭配的邻接属性,一般是否相邻出现,0表示一般需要邻接使用,1表示可以邻接使用,2表示一般不邻接使用。(7) T:搭配的翻译,其后数字表示翻译的编号。通常情况下,Tl母语语料库中的使用频率高于T2o(8) TD:表示构成对译关系的翻译编号。所谓对译是指英文译文
3、是对汉语搭配的逐词逐块翻译,具有相同的语序,并且译文的语法性质与汉语搭配的语法性质基本一致。0或空表示译文均非对译,1表示第一组译文是对译,2表示第二组译文是对译,12表示译文均是对译。(9) PLT:推荐教学等级,考虑三个因素:词语等级、频率和翻译难度,其标注体系由这三个因素的标识复合而成;首位数字表示搭配的词语等级属性,取值为两个搭配词的最大等级,取值范围为1,6,表示学生学习该搭配应当具有或正在学习的词汇水平;第二位字母表示高频或低频搭配,H表示高频搭配,L表示低频搭配,高频搭配推荐优先教学;第三位数字表示翻译难度,基于第一组翻译Tl进行判断,考虑翻译方式、语序、结构关系、语法性质、语块
4、数、语块义等六个要素,取值范围为0,10,数值越高翻译难度越大,习得难度也越大。(10) S:例句,其后数字表示例句的编号。3搭配网络(词语组合网络)搭配网络使用d3.js中的力导向图实现。其中,节点表示并标有词语,弧表示语法关系,箭头表示搭配先后关系。节点的大小表示节点词语在当前搭配知识库(子库)中构成搭配的相对频次多少,弧的粗细表示检索结果集中当前搭配出现的相对频次多少。节点可以拖曳。弧上信息的展示包括三个动作。为当鼠标在弧上驻停的时候,以粉红色高亮显示搭配的语法结构、频次信息和连线,鼠标移出弧的时候弧恢复原状;当用户单击弧的时候,表格自动滚动至网页视窗范围内,表格内容中对应的搭配信息被粉红色点亮,并自动滚动至表格视窗范围内,鼠标移出时表格不恢复原状,同时显示例句信息;当用户双击弧的时候,表格中被粉红色点亮的搭配信息恢复黑色。搭配网络是真正的网状结构,由于显示空间限制,我们只呈现了第一层网状结构,表现为以检索词为中心的射线状网络结构。双击该网络中的某个词语节点,可以跳转到以该词语节点为检索词的搭配网络中。