基于语料库的中日同形词词义用法对比及其日中机器翻译探讨[日语论文]

资料分类免费日语论文 责任编辑:小天老师更新时间:2017-04-18
提示:本资料为网络收集免费论文,存在不完整性。建议下载本站其它完整的收费论文。使用可通过查重系统的论文,才是您毕业的保障。

汉语和日语都使用汉字,因此产生了大量的形词。中日形词是指中日两种语言中汉字字形相同的词语。其中,许多中日同形词在词义上产生了异同,本文将这类词称之为中日同形异义词。关于中国的日语学习者和日本的汉语学习者来讲,由于其各自的母语干涉,容易造成中日同形异义词的误用和误译。因此,中日同形异义词也成为了中日两国语言教学中的一个重要内容之一。
  先行探讨中,从历史、文化、第二语言习得的角度来探讨中日同形异义词的成果较多,但是从语料库语言学和机器翻译的角度来探讨中日同形异义词的还不多见。另一方面,20世纪50年代以后,有关机器...

引言:

汉语和日语都使用汉字,因此产生了大量的同形词。中日同形词是指中日两种语言中汉字字形相同的词语。其中,许多中日同形词在词义上产生了异同,本文将这类词称之为中日同形异义词。关于中国的日语学习者和日本的汉语学习者来讲,由于其各自的母语干涉,容易造成中日同形异义词的误用和误译。因此,中日同形异义词也成为了中日两国语言教学中的一个重要内容之一。
  先行探讨中,从历史、文化、第二语言习得的角度来探讨中日同形异义词的成果较多,但是从语料库语言学和机器翻译的角度来探讨中日同形异义词的还不多见。另一方面,20世纪50年代以后,有关机器翻译的探讨开始盛行起来。在同汉字圈的日语和汉语间的机器翻译中,有关日汉语言对比、机器翻译系统开发等方面的探讨显得非常必要。当前,现有的免费网络翻译软件对中日同形异义词的误译依然存在。因此,从机器翻译的角度来探讨中日同形异义词是十分必要的且具有一定价值。
  本论文对中日同形异义词进行探讨,选取了日语サ变动词「打破する」、「散発する」、「採取する」及其汉语同形词“打破”、“散发”、“采取”这三组词汇为具体探讨对象进行考察。首先,在先行探讨的基础上,从语料库语言学的角度,利用日语的『基于网络数据的サ变动词数据库(开发版)』语料库以及汉语的『CCL语料库检索系统(网络版)』语料库抽取了大量的数据,对比略论了这三组中日同形异义词在义项、义项使用频度以及词语搭配方面的的差异点。其次,从机器翻译的角度,基于格语法理论,考察了「打破する」、「散発する」、「採取する」的搭配名词的语义属性及其各自出现频度最高的汉语译词,制作了其日中机器翻译规则。最后,从『京都学院格フレーム』语料库中抽取含有「打破する」、「散発する」、「採取する」的各自100个例句,共计300句作为翻译实验数据,结合一个试验性的日中机器翻译系统进行了翻译实验。翻译实验结果显示,用本探讨制作的机器翻译规则得到了92%的平均正确率,与某网络免费翻译软件46%的平均正确率相比,表明了本探讨翻译措施和翻译规则具有一定的有效性。
  笔者期待本探讨成果能够为中日同形词的教学与探讨提供有效的参考。同时,还期望能够为日中机器翻译提供一定的借鉴。今后将考察更多的词汇,为中日同形异义词的日中机器翻译提供更为详细的参考,以提高机器翻译译文质量。

参考文献:

日语毕业论文日语论文
免费论文题目: