语料库和词典结构
- 格式:ppt
- 大小:282.00 KB
- 文档页数:17
英语词块整理及使用一、词块定义词块是指语言中预制的、整体存储的、以固定或半固定形式存在的、频繁使用的多个词的组合,这种组合既可以是语法、语义完整的句子,也可以是短语、甚至是词汇,并具有一定的语用功能。
二、词块分类1. 聚合词(Polywords):由一个以上单词组成的固定短语,语义完整,作为一个不可分割的整体出现。
如:get down(下来),in order to(为了),how are you(你好)等。
2. 惯用表达(Idioms):固定的、整体储存的、不可拆分的短语,其含义不能从其组成部分推断出来。
如:out of the blue(突然地),once and for all(一劳永逸地)等。
3. 限制性短语(Phrasal constraints):由某些固定词语构成的短语,其形式和意义可以变化,但变化是受一定规则限制的。
如:a piece of cake(轻而易举的事),by the way(顺便说一下)等。
4. 句子框架和引语(Sentence frames and heads):为整个句子提供框架或引导语,包括某些常用的开头或结尾的短语。
如:I’m sorry to hear that(听到这个消息我很难过),It’s important to remember(重要的是要记住)等。
三、词块使用优势1. 提高语言准确性:使用固定或半固定的词块可以有效减少语言错误,提高语言表达的准确性。
2. 提高语言流利性:由于词块是整体存储和提取的,使用它们可以减少语言生成时大脑的认知负担,使说话者更流利地表达自己的思想。
3. 提高语言地道性:使用地道的英语词块可以使语言更符合英语习惯,避免出现生硬的中式英语表达。
4. 提高语言学习效率:通过记忆和运用词块,可以更高效地学习英语,因为这样可以在一定程度上避免逐个记忆单词和语法的繁琐过程。
四、如何整理和使用英语词块1. 收集和整理:在日常阅读、听力练习和口语交流中,注意积累和整理遇到的英语词块。
汉语情感语料库-概述说明以及解释1.引言概述:汉语情感语料库是一个包含大量情感相关数据的语言资源库,用于帮助研究人员分析和理解汉语中的情感表达。
情感在人类交流和社交中起着重要作用,对于情感分析和情感识别技术的发展具有重要意义。
本文将介绍汉语情感语料库的定义、构建方法以及在情感分析中的应用,旨在促进汉语情感研究领域的发展和应用。
1.1 概述部分的内容1.2 文章结构本文主要分为以下几个部分。
首先在引言部分,将对汉语情感语料库进行概述,并介绍本文的结构安排。
其次,在正文部分,将详细介绍汉语情感语料库的定义、构建方法以及在情感分析中的应用。
最后在结论部分,将对全文进行总结,探讨汉语情感语料库的意义,并展望未来在情感分析领域的发展前景。
通过这样的结构安排,读者可以全面了解汉语情感语料库及其在情感分析中的重要性和应用价值。
1.3 目的:汉语情感语料库的建立旨在为情感分析领域的研究提供更为丰富和准确的数据支持。
情感分析是近年来人工智能领域中一个备受关注的研究方向,通过分析文本中表达的情感信息,可以帮助我们更好地理解人们的情感倾向和态度。
而汉语情感语料库作为情感分析研究的基础资源,能够提供大量真实和具有代表性的语言数据,有助于提高情感分析算法的准确性和效果。
通过构建汉语情感语料库,我们可以更好地了解汉语文本中不同情感类别的表达方式和特征,为情感分析模型的训练和验证提供可靠的数据基础。
同时,汉语情感语料库的建立也有助于促进情感分析研究的发展和应用,为相关领域的学术研究和商业应用提供支持和借鉴。
总的来说,建立汉语情感语料库的目的是为了推动情感分析领域的发展,提高情感分析模型的性能和效果,推动智能技术在文本情感分析方面的应用和创新。
通过汉语情感语料库的构建和使用,我们能够更好地理解和分析汉语文本中的情感信息,为人工智能领域的发展贡献我们的一份力量。
2.正文2.1 汉语情感语料库的定义汉语情感语料库是指收集整理了大量具有情感色彩的汉语文本数据的资源库。
语料库语言学简介语料库语言学是指利用语料库(一种大规模的文本数据集合)进行语言学研究的方法和理论。
通过构建、标注和分析语料库,可以揭示语言在不同层面上的特征和规律,为自然语言处理、机器翻译等领域提供基础和支持。
语料库语言学的研究内容包括:语言的音系、形态、句法以及语义等方面;语言的变异、演化和变化;语言使用者的使用习惯、语言背景和社会属性等。
语料库语言学的主要方法包括:语料库的构建和管理、语料库的标注和注释、语料库的查询和分析、语料库的应用和评估等。
语料库语言学的应用领域包括:机器翻译、信息检索、语音识别、文本分类、自然语言生成等。
此外,语料库语言学还被广泛应用于各种语言教学、语言规划和语言政策制定等领域。
总的来说,语料库语言学已经成为现代语言学和自然语言处理领域不可或缺的一部分,对于研究和应用语言都有着重要的意义。
一、语料库语言学的意义(一)定义和概述语料库语言学是指利用计算机对大规模语料库进行统计学分析、计算和比较,从而研究语言规律和现象的语言学方法。
语料库是指收集、整理、储存在计算机中的自然语言文本,包括书面文本和口语文本。
语料库语言学旨在通过对语言数据的分析,揭示语言的内在规律和现象,为语言学、语言教学、翻译等领域提供科学依据。
(二)语料库语言学的历史语料库语言学起源于20世纪50年代的美国,当时ChomSky等人提出了生成文法理论,但是这个理论无法解释自然语言的很多现象。
50年代后期,美国普林斯顿大学的SinClair教授提出了使用实际语言数据进行语言研究的观点,并开始编制语料库,由此开启了语料库语言学的先河。
之后,随着计算机技术的发展,语料库语言学得以快速发展,成为现代语言学研究和应用的重要领域。
二、语料库语言学的重要性(一)提供真实语言数据语料库收集大量的自然语言文本,包括书面语和口语,具有代表性和真实性。
这些数据包含了语言使用中的各种现象和规律,是研究语言的最基本素材。
(二)揭示语言规律和现象语料库语言学可以对语言数据进行分析、计算和比较,从而揭示语言的内在规律和现象。
关于语料库的三点基本认识:语料库中存放的是在语言的实际使用中真实出现过的语言材料;语料库是以电子计算机为载体承载语言知识的基础资源;真实语料需要经过加工(分析和处理),才能成为有用的资源;在语言学中,语料库(Corpus)指大量文本的集合,库中的文本(称为语料)通常经过整理,具有既定的格式与标记,特指计算机存储的数字化语料库。
语料库是语料库语言学研究的基础资源,也是经验主义语言研究方法的主要资源。
应用于词典编纂,语言教学,传统语言研究,自然语言处理中基于统计或实例的研究等方面。
分类语料库有多种类型,确定类型的主要依据是它的研究目的和用途,这一点往往能够体现在语料采集的原则和方式上。
有人曾经把语料库分成四种类型:(1)异质的(Heterogeneous):没有特定的语料收集原则,广泛收集并原样存储各种语料;(2)同质的(Homogeneous):只收集同一类内容的语料;(3)系统的(Systematic):根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围内的语言事实;(4)专用的(Specialized):只收集用于某一特定用途的语料。
除此之外,按照语料的语种,语料库也可以分成单语的(Monolingual)、双语的(Bilingual)和多语的(Multilingual)。
按照语料的采集单位,语料库又可以分为语篇的、语句的、短语的。
双语和多语语料库按照语料的组织形式,还可以分为平行(对齐)语料库和比较语料库,前者的语料构成译文关系,多用于机器翻译、双语词典编撰等应用领域,后者将表述同样内容的不同语言文本收集到一起,多用于语言对比研究。
目前已经累积了大量各种类型的语料库,如:葡萄牙语种树库、面向文本分类研究的中英文新闻分类语料库、路透社文本分类训练语料库、中文文本分类语料库、大开放字幕库OpenSubtitles的多语言平行语料数据(OpenSubtitles Corpus)、《圣经》双语语料库("Bible" bilingual corpus)、Short messages service(SMS ) corpus(短消息服务(SMS)语料)等。
近年来,随着认知语言学的发展和各语言数据库的构建,基于语料库揭示语词的语义特征和词汇关系的研究受到学界的广泛关注,随之而兴起的是基于语料库进行的词典学编纂研究。
语料库在现代被认为是词典编纂过程的必要组成成分,基于语料库的词典释义新型途径是对传统释义方式的一种重要补充。
本文对基于语料库进行词典释义的历史和现状研究进行分析,在此基础上阐述此类研究的优势和局限性。
一、语料库研究概述语言研究中的语料库是指以分析语言特征为目的而收集起来的文本集合。
(Landau2005:298),有一定的结构,有代表性,可被计算机程序检索,具有一定规模。
(冯志伟2009)。
Sinclair(1991)认为,语言描述只有以自然语境中的真实语言为基础才能进行准确客观的描述。
Biber等人(Biber,Conrad&Reppen1998:3)认为,语料库分析研究的目的不是为了判断语言语法的正确性,而是为了通过大规模的语言现实数据来揭示语言使用的典型模式。
Leech (1993:107)认为语料库语言学有如下特点:以语言的应用而不是语言能力为中心;以语言描写而不是语言普遍性为中心;以语言的定量及其定性模型为中心;以经验主义而不是理性主义的科学研究方法为中心。
目前国际主流英语词典均采用语料库进行编纂,如Collins Cobuild词典采用Sinclair主持的COBUILD语料库,朗文ESL词典使用朗文语料库进行词典编纂,《牛津高阶学习词典》使用BNC语料库,《剑桥国际英语词典》使用剑桥国际语料库。
此外,词典编纂也开始使用一些具有先进的检索分析工具和语法自动标注体系的语料库,如word sketch engine等语料库为语词提供了较为精确的词汇描述。
二、利用语料库进行词典释义编纂的优势语料库应用于词典编纂研究主要存在以下几点优势:1.提供更客观的语言事实。
语料库能够用来发现相关的、核心的、典型的事实(如例证、搭配等),它全面展现了母语者使用语词的自然语境,而这种语境恰好是非母语者所缺乏的语感。
机器翻译中的词典和术语库构建方法机器翻译(Machine Translation, MT)是指使用计算机和自然语言处理技术进行自动翻译的过程。
为了提高翻译质量和效率,构建有效的词典和术语库是机器翻译的关键之一。
本文将介绍。
一、词典构建方法1. 人工构建人工构建词典是最常见的方法之一。
翻译专家根据专业知识和语言能力,将词语和短语直接进行翻译,形成双语对照的词典。
这种方法可以保证翻译的准确性和专业性,但是构建过程耗时且需要大量人力资源。
此外,人工构建的词典需要定期更新和维护,才能适应新的语言变化和文化差异。
2. 自动抽取自动抽取是利用机器学习技术和大规模语料库,通过统计和推理方法自动提取词典。
具体步骤包括:分词,统计词频和概率,根据一定的阈值选择高频词汇作为词典的候选词,然后利用上下文信息进行进一步筛选。
自动抽取的优点是可以快速构建较大规模的词典,但是抽取过程中可能出现语义漂移和误抽取等问题,需要进行后期的人工校对和纠错。
3. 词性标注与词义消歧在词典构建过程中,词性标注和词义消歧是非常重要的环节。
词性标注可以帮助机器翻译系统准确判断词语的句法角色和语义关系,进而提高翻译的准确性。
词义消歧则是根据上下文信息对多义词进行判断,从而确定正确的翻译。
词性标注和词义消歧可以通过规则、统计和机器学习等方法进行。
二、术语库构建方法术语库是机器翻译中处理特定领域或专业术语的重要工具。
下面介绍几种术语库构建方法。
1. 人工构建与词典类似,人工构建术语库是一种常见的方法。
翻译专家根据领域知识和语言能力,将特定领域的术语进行整理和翻译,形成双语对照的术语库。
人工构建的术语库可以保证翻译的准确性和专业性,但是构建过程耗时且需要大量人力资源。
2. 自动抽取自动抽取是指利用机器学习和大规模语料库,通过统计和推理方法自动提取术语库。
具体步骤包括:根据特定领域的文本和上下文信息,统计词频和共现频率,根据一定的阈值选择高频词汇作为术语的候选词,然后利用上下文信息进行进一步筛选。
1.语言迁移:在学习外语的过程中,作为来源语的母语作为目标语的外语会产生影响,这就叫语言迁移。
2.音位:在具体语言或方言中具有区别意义功能的最小语音单位叫音位。
3.书面语:书面语是文字产生以后才出现的语言的另一种存在形式,它在口语的基础上产生,是经过加工、提炼和发展了的口语的书面形式。
4.国际音标:国际音标是目前国际上最为通行的音标,它根据一个音素只用一个音标表示,一个音标只表示一个音素的原则制定,音素和标写音素的符号一一对应,没有标音含混的缺陷,能够比较精确地记录世界上各种语言的语音。
1.元辅音分析法:元辅音分析法是以元辅音为基本分析单位的一种音节结构分析方法。
音节结构可氛围V、C-V、V-C、C-V-C等四种不同结构类型。
例如,汉语普通话中的[i](一)、[t‘i](题)、[an](安)、[t‘an](谈)等四个音节分别属于这四种基本类型。
2.语法形式:语法形式就是能体现语法意义的形式;表示某一类语法意义或有共同作用的形式,如词类形式、组合形式、虚词形式,就是语法形式3.义项:义项是词典释义的最小单位,一个词有几个义项,是根据词所反映的对象的多少确定的。
例如,“凉”既可以表示“温度低”,也可以表示“灰心或失望”,因而是两个义项4.外语教学的听说法:听说法是受结构主义语言学“刺激——反应”学说影响二产生的外语教学法;听说法基本上不使用本族语教学,不大进行语言对比,一般也不讲语法规则;这种教学法在读写能力和语言分析能力的培养方面较弱。
1.语言获得:主要是指掌握一种母语,特别是儿童掌握自己母语的过程。
2.双语现象:指某一语言社团使用两种或多种语言的社会现象。
3.借词:是指音和义都是借自外语词,又叫外来词。
4.词组:实词与实词之间具有直接联系的相对独立的词群。
1.区别特征:具有区别音位作用的语言特征叫区别特征。
音位之间的对立可以进一步分解为区别特征之间的对立,音位的辩义功能归根结底是由区别特征担负的。
专业的翻译工具与技术在现代社会中,随着全球化的发展,翻译行业的需求也日益增长。
为了提高翻译效率和准确度,专业的翻译工具与技术起到了重要的作用。
本文将介绍几种常见的专业翻译工具与技术,并探讨其在翻译领域中的应用。
一、计算机辅助翻译工具(Computer-Assisted Translation Tools,CAT)计算机辅助翻译工具是翻译行业中常用的工具之一。
它能够自动处理文本,并提供一系列功能来提高翻译的效率和准确度。
其中,最常用的CAT工具是电子词典和术语库。
电子词典可以帮助翻译人员迅速查找单词的含义和用法,而术语库则提供了特定领域的术语翻译,能够保持翻译的一致性。
二、机器翻译技术(Machine Translation,MT)机器翻译技术是利用计算机程序将源语言的文本自动转化为目标语言的文本。
目前,机器翻译技术已经取得了很大的进展,在某些特定领域的翻译中已经能够达到较高的准确度。
机器翻译技术的主要优势在于速度快、可扩展性强,但相比于人工翻译,其准确度仍然有待提高。
三、语料库与平行语料库(Corpora and Parallel Corpora)语料库是指收集并整理的大规模文本库,其中既包括源语言文本,也包括目标语言文本。
平行语料库是指同时包含源语言文本和目标语言文本的语料库。
借助语料库和平行语料库,翻译人员可以通过文本检索和对比分析,更好地理解源语言文本,同时在翻译过程中能够提高准确度和翻译一致性。
四、语音识别技术(Speech Recognition)语音识别技术是将语音信号转化为文字的过程,它在口译和录音转录等方面有着广泛的应用。
通过语音识别技术,翻译人员可以将口译的内容转化为文字,从而进行后续的翻译工作。
这样既提高了翻译的准确度,也提高了翻译人员的工作效率。
五、云端翻译平台(Cloud Translation Platform)随着云计算技术的发展,云端翻译平台成为了翻译行业中的新趋势。
语料库简介及国内的语料库建设摘要:语料库作为一种随着计算机技术发展而广泛应用的新兴的语言研究工具,在语言的定量分析上有极大的作用。
本文正是基于语料库的这种重要性,对国内外的语料库建设发展进行了简介,并且分析了国内语料库建设的不足。
关键词:语料库;国内语料库;语料库语言学1、语料库发展综述语料库通常指为一个或多个语言研究目标而专门收集的、有一定结构的、具有一定规模的、用电子形式保存的、可以被计算机程序检索的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。
人们通过语料库观察和把握语言事实,分析和研究语言系统的规律。
语料库已经成为语言学理论研究、应用研究和语言工程不可缺少的基础资源。
下面对语料库发展的四个时期进行分别介绍。
1.1手工语料库时期18世纪开始到20世纪50年代,语料的研究都是手工进行的,由人工收集,将需要的词或句子写在纸条上,然后整理成卡片进行检索。
涉及到了圣经与文学研究、词典编纂、语言教育研究、语法研究和方言研究、儿童语言习得和语言比较的研究中。
他们使用大规模语言资料来进行语言研究的工作,是具有开创性的。
但这些语料库都是手工建立的,研究者们假定自然语言的句子是有限的。
这些有限的句子可以收藏和列举,语料库可以作为语言研究的唯一可靠的数据来源,这样的看法难免由片面的地方。
他们使用的语言材料都不是机器可读的,所以还不能算成是真正意义上的语料库。
代表人物是伦敦大学的奎克,他提出了英语用法调查语料库,代表了使用手工方法建立的语料库的最高水平。
1.2 第一代电子语料库时期20世纪五十年代到80年代,出现了机器可读的语料库。
语料库来到了电子或电脑化的时代。
在这个时期建立了布朗语料库、LOB语料库、LLC语料库等影响十分大的语料库。
语料均为书面语,缺乏口语和手稿。
这些语料库的规模都比较小,布朗语料库和LOB语料库都只有100万词左右。
这些小规模的语料库只能用来考察常用语言现象的频率,无法展示语言的全貌。
二语学习者的汉语易混淆词语词典和语料库建设面向二语学习者的汉语易混淆词语词典和语料库建设关键词二语学习易混淆词语词典语料库一、引言对外汉语教师普遍认为,词语辨析是教学中的难点。
学生可能难以分清一些只有微妙差异且意思比较抽象的,如“孤单/孤独/寂寞”“居然/竟/竟然”等的用法;也可能因母语的影响,误解或误用了在教师看来无需辨析的词对,如“祖国/故乡”“偏偏/故意”等;一些同译词也是相应母语学习者辨析的难点,如“本质/自然”是英语同译词,“事实/内容”是法语同译词,“正确/公平”是西语同译词,“赞同/满足”是阿语同译词。
(郭志良 1988)鉴于此,有学者提出使用“易混淆词语”(confusable words)的概念,并指出“‘易混淆词语’是站在中介语的立场、着眼于目的语理解和使用中的词语混淆现象并根据混淆的普遍程度归纳出来的词语类聚”。
(张博 20xx)二、词典编写理念我们编写词典的理念是:“授人以鱼”的同时“授人以渔”。
此类词典不仅应能帮助二语学习者辨析所列的易混淆词语,还能帮助他们掌握辨析的方法。
1.编纂针对不同母语学习者的汉语易混淆词语词典有些易混淆词语是由于汉语系统内部原因产生的,有些则可能是因学生母语迁移产生的。
后一种类型中有些可能具有语种的普遍性,有些则可能只针对个别语种。
如日韩语的汉字与汉语汉字的混淆;又如引言部分所列举的同译词。
这些同译词的混淆只在相应的语种中存在。
鉴于此,应该编写针对不同母语的汉语易混淆词语词典,如《面向英语学习者的汉语易混淆词语词典》《面向日语学习者的汉语易混淆词语词典》等等。
2.易混淆词语的来源、类型及辨析维度有些易混淆词语只是个别现象,另一些则具有一定的普遍性,词典收词范围应为后者。
而针对某一母语又具有普遍性的易混淆词语如何得来呢?(1)易混淆词语来源是不是所有的汉语近义词、同义词词典中的条目都需要纳入考虑呢?不然!因为有些近义词由于可以借助其母语翻译中介或其他手段加以区分,对于有些学习者而言,不算易混淆词语;而有些近义词较生僻,二语学习者学习的词语主要是词汇等级大纲中的词语,平时使用汉语主要是完成日常交际,那些书面性、文学性很强,或使用频度很低,或带方言古语意味的词语一般不会遇到,这些词语形成的易混淆词语对他们而言,一般可以忽略。
三、名词解释题〖可转化为选择题1、词法范畴:由词的变化来表示语法意义的形式就是词法范畴。
2、词法手段:通过词的变化表现语法意义的形式叫做词法手段。
3、语调:是通过整个句子的音高、音重、停顿等来表示一定语法意义的形式。
4、语序:是通过句法结构中词语的位置顺序来表示一定语法意义的形式。
5、体词性范畴:指名词的词形变化形式表示的意义。
6、谓词性范畴:指动词的词形变化形式表示的意义。
7、谓词性词组:整个词组的功能相当于谓词的词组。
8、体词性词组:整个词组的功能相当于体词的词组。
9、非主谓句;不具有主谓的结构形式但一般不需要或不能补出成分的句子就是非主谓句。
10、句组:由几个相对独立意义的句子(包括单句和复句)构成,句中没有特定的连接词,而且中间还有多个较大停顿(书面上分别用几个句末标点符号)的语言片断叫做句组。
11、复句:由两个成两个以上互不从属的主谓结构组成。
表达多个相互关联的较完整的意义,并且中间有较小停顿,或有特定的连接词连接。
前后有较大停顿的句子。
12、多重复句,由几个句子构成,说的是关系密切的一件事,句子之间有相互关联的连接词,末尾只有一个较大的停顿(书面上用一个句末标点符号)的语言片断。
13、复杂结构单句:包含着从属或降级主谓结构的内部结构复杂的单句叫做复杂结构单句。
1.词的通俗意义:由于概括深度的差异分出助词的理性意义的一种类型,是人们对事物所具有的一组非本质性特征的反映。
2.词的科学意义:由于概括深度的差异分出的词的理性意义的一种类型,是人们对事物的本质特征的反映。
3.义素分析:把词语的义项进一步分析为若干义素的组合,以便说明词义的结构、词义之间的异同以及词义之间的各种关系。
4.基本义:多义词的多个意义中的某个时期最常用、最主要的意义。
5.派生义:多义词的多个意义中直接或间接地从本义衍生出来的意义,也叫引申义。
6.等义词:指包括理性意义和非理性意义(附加色彩)在内的词完全相同的两个或两个以上的词。
约翰逊的英语词典引言概述:约翰逊的英语词典是一部被广泛认可的权威性英语词典,由英国学者塞缪尔·约翰逊于18世纪中叶编纂而成。
它不仅是一部重要的语言学著作,更是英语学习者和研究者的宝贵资源。
本文将从五个大点详细阐述约翰逊的英语词典的意义和特点。
正文内容:1. 约翰逊的英语词典的历史意义1.1 词典编纂的背景和目的约翰逊的英语词典是在18世纪英国英语发展的背景下编纂而成的,旨在规范英语的用法和拼写。
当时,英语的拼写和用法存在较大的混乱,约翰逊希望通过编纂一部权威性的词典来统一英语的规范。
1.2 编纂过程和困难约翰逊的英语词典的编纂过程艰辛而漫长。
他自己亲自查阅了大量的文献,收集了大量的例句和定义,以确保词典的准确性和权威性。
然而,由于当时英语的变体众多,约翰逊面临着很大的困难,需要进行大量的研究和对比,以确保词典的全面性和准确性。
1.3 对英语学习和研究的影响约翰逊的英语词典对英语学习和研究产生了深远的影响。
它为英语学习者提供了一本全面而准确的词典,帮助他们理解和运用英语。
同时,它也为英语研究者提供了重要的语料库和参考资料,促进了英语语言学的发展。
2. 约翰逊的英语词典的语言学意义2.1 词典的组织结构约翰逊的英语词典采用了字母顺序的组织结构,使得读者可以方便地查找单词。
同时,词典还提供了详细的释义、词性和例句,帮助读者理解和运用单词。
2.2 词典的语言描述约翰逊的英语词典以其准确的语言描述而闻名。
它提供了详细的定义和例句,帮助读者准确理解单词的意义和用法。
同时,词典还对单词的词源和历史变化进行了详细的解释,丰富了读者对英语语言的理解。
2.3 词典的语言规范约翰逊的英语词典在编纂过程中致力于规范英语的用法和拼写。
它提供了标准的拼写和用法,帮助读者避免使用错误或不规范的英语。
词典的语言规范性对英语的发展和推广起到了重要的作用。
3. 约翰逊的英语词典的文化意义3.1 词典对英国文化的反映约翰逊的英语词典不仅是一部语言学著作,更是对当时英国文化的重要反映。
基于语料库的商务汉语学习词典的编写设想一、本文概述本文主要探讨了基于语料库的商务汉语学习词典的编写设想。
随着中国社会经济的快速发展,商务汉语教学日益受到关注,目前市场上缺乏专门为来华留学生编写的商务汉语学习词典。
本文旨在填补这一空白,利用语料库理论和信息处理技术,确立了一份分等级的商务汉语词语表,并建立了“商务汉语教材语料库”。
在此基础上,文章试图突破以往对外汉语学习词典的编纂方法,提出了编写基于语料库的商务汉语学习词典的理论依据和具体操作的设想。
通过这种方式,旨在为商务汉语学习者提供一本实用、易懂的学习词典,以满足他们在商务汉语学习过程中的需求。
二、商务汉语的特点与需求分析商务汉语,作为专门用途汉语的一个重要分支,具有其独特的特点与需求。
本节将从商务汉语的语言特点、学习者需求以及教学需求三个方面进行分析。
(1)专业性强:商务汉语涉及大量商务领域的专业词汇和表达,如合同、谈判、市场营销等。
这些词汇和表达在商务活动中具有特定的含义和用法。
(2)实用性强:商务汉语强调实际应用,学习者需要掌握如何在商务场景中进行有效沟通,包括商务写作、商务谈判等。
(3)文化内涵丰富:商务活动不仅仅是经济交流,更是文化交流。
商务汉语中包含许多与中国商务文化相关的表达和习俗。
(1)提高商务沟通能力:学习者希望通过学习商务汉语,能够在中国或与中国的商务活动中进行有效沟通。
(2)掌握商务知识和术语:学习者需要了解商务领域的知识和术语,以便在商务场合中准确表达。
(3)适应商务文化:学习者需要了解中国的商务文化,以便在商务活动中遵循相应的礼仪和习俗。
(1)实用性教学材料:需要提供实用的商务汉语教学材料,包括真实的商务场景对话、案例等。
(2)专业教师:商务汉语教学需要具备商务知识和教学经验的教师,以指导学生正确理解和运用商务汉语。
(3)文化教学:商务汉语教学应包含对中国商务文化的介绍,帮助学生理解和适应商务环境。
商务汉语的特点与需求表明,编写一本基于语料库的商务汉语学习词典具有重要的实际意义。
语料库在《对外汉语新词语词典》微观结构中的运用
崔乐
【期刊名称】《重庆理工大学学报》
【年(卷),期】2011(025)010
【摘要】随着计算机技术的发展与语料库技术的日益成熟,语料库在词典编纂中的巨大功用已成为共识。
《对外汉语新词语词典》是面向以汉语作为外语的中高级水平学习者的外向性、积极型学习词典。
语料库在《对外汉语新词语词典》编纂中的运用渗透在每一个微观结构中,语料库技术提供的丰富的语言知识与语言资源使词典编纂更加方便快捷,有力地促进了外向性词典编纂由传统的经验型向现代的科学型转变。
【总页数】7页(P84-89,107)
【作者】崔乐
【作者单位】中国传媒大学文学院,北京100024
【正文语种】中文
【中图分类】H164
【相关文献】
1.论对外汉语新词语词典的释义原则与方法
2.论外向性词典的简易性原则——基于对外汉语新词语词典的编纂探索
3.语料库在《对外汉语新词语词典》微观结构中的运用
4.语料库技术在外向性词典元语言控制中的应用——以对外汉语新词语词典为例
5.论对外汉语新词语词典的编纂与研究
因版权原因,仅展示原文概要,查看原文内容请购买。
词典学术语abbreviation 缩略语abbreviative notation 缩略标记abridged 删节的,未足本的abridged dictionary节本词典abridgement 删节,节本absolute equivalent 绝对对应词absolute synonym 绝对同义词abusage 滥用abusive language 辱骂语academic dictionary 学术词典academic lexicography 学术词典学academy dictionary 学院词典accent mark 重音号acceptability 接受性acceptability rating 接受等级access alphabet 检索字母表access point 检索项access structure 检索结构acknowledges 致谢项acrolect 上层方言acronym 首字母缩略词active dictionary 积极词典,主动性词典active vocabulary 积极词汇adjectival noun 形容词性名词adjective complement 形容词性补语adjective compound 复合形容词adjunct 附加性副词adnominal 名词修饰语advanced searches 高级搜索affix 词缀affixation 词缀法,词缀词agglutinative language 黏着型语言alien word 外来词allomorph 语素变体allophone 音位变体allusion 典故alphabetic arrangement 字母顺序排列alphabetic order 字母顺序alphabetic sequence 字母顺序alphabetic writing 字母文字,拼音文字alphabetization 按字母顺序排列alphanumeric combination字母数字组合词alphapedia 字顺百科alternative lexicography 另类词典学ambiguity 歧义ambilogy 双关语amelioration of meaning 词义的扬升Americanism 美国词语,美式英语Ampersand &号(=and)analogical dictionary 类义词典analytic definition 分析式释义analytic language 分析型语言analytical ordering 分析排列angle brackets 尖括号animate noun 生物名词,动物名词anisomorphism 语言差异性antedating 早于已摘录文献的引语anthroponymy 人名学antidictionary 反动词典appendix 附录appreciative 赞赏的,褒义的appropriateness 得体性,适切性approximative equivalent 近义对等词arch 弓形符(即︵)archaic word 古词archaism 古体,古语archaizing dictionary 仿古词典archeography 古文献学archive 引语档案areal linguistics 区域语言学argot 黑话arrow 箭号article 词条,条目artificial language 人工语言asserted meaning 陈述意义association 联想association by contiguity 相邻联想association by contrast 对比联想association by similarity 类似联想association group 联想词群associational word 联想词associative meaning 联想意义asterisk 星号(*)at 单价号(@)attestation isolee 个别使用attributive adjective 修饰性形容词authentic example 真确性例证authentication 求证authenticity 真实性author dictionary 独编词典author’s dictionary 作家词典automatic lemmatization 自动归目automatic lexicography 自动词典学autosemantic word 自义词auxiliary verb 助动词back clipping 截尾缩略back matter 附录部分,后文back matter structure 附录结构back page material 后页材料back-formation 逆构词法backward dictionary 逆序词典,倒排词典barbarism 不纯正的词语,粗野语base 词基,词根base structure 基础结构base word 词目base-repeating 词根重叠释义法basic searches 基本搜索basic sense 基本义项basic vocabulary基本词汇basic word stock 基本词汇bias word 倾向性词语bias-free vocabulary 无偏见词汇biblical expression 圣经词语bibliography书目;目录学bidirectional dictionary 双向双语词典bifunctional dictionary 双功能词典big dictionary 大型词典bilingual dictionary 双语词典bilingual edition双解本,双解版bilingual learner’s dictionary双语学习词典bilingual lexicography双语词典学bilingual thesaurus 双语分类词典bilingualized dictionary双解词典biographical dictionary人名词典biographical entry人名条目biographical lexicography 人名词典学biographical sources传记资料blend 混成词,拼缀词blending 混成法,拼缀法;拼缀词bogey怪字bold-faced type 黑体字borrowed word 外借词borrowing 借词bound equivalent局限对应词bound form 黏附形式bound morpheme黏着词素bound root 黏着词根braces大括号brackets 方括号breve 短音符bridge dictionary桥接词典British National Corpus 英国国家语料库broad notation 宽式标音法broad transcription 宽式音标,宽式记音法browser 浏览器buying guide 购买指南cacography拼写错误cacology 用词不当calque仿照词canonical form 标准形式cant 隐语,黑话capital letter 大写字母caret 脱字号(^)casual style 随便语体,随意文本catachresis 词语误用catchword眉词,导词categorical diversity 范畴的差异性categorical equivalence范畴对应关系categorical identity 范畴一致性categorization 划分范畴,归类caution 提醒号CD-ROM dictionary光盘词典censorship 审查制度census 普查,调查centered period 分节点,音节号,中黑点(·)character dictionary 字典character set 字集check mark 核对号(√)children’s dictionary 儿童词典chronological dictionary 序时词典circular definition 循环释义circularity 循环释义,互训circumflex音调符号,长音符号circumlocution 迂回曲折表达法,遁词citation 引语,书证,例证citation file引例档案classificatory label 分类标注,类别标记clause idiom 成语性分句cliché陈词滥调clipped form 截短形式clipped word 截短词clipping 截短法close construction 封闭结构closed combination 封闭型组合closed corpus 封闭式语料库closed-class words 封闭性词类code 代码codification 编码coding代码化cognate 同源词cognitive meaning 认知意义coherence 连贯性co-hyponym 共下义词,共同受支配词coinage 新造词语coined term 新造术语coined word 新造词,新创词college dictionary大学词典collegiate dictionary 大学词典collocation 搭配(关系)collocational information 搭配信息collocative meaning 搭配意义colloquial language 口语colloquial standard 口语标准语colloquial word 口语词colloquialism 口语词colorpedia 彩图百科comb effect 梳子效应combinatory possibility 组合可能性combinatory variant 组合变体combining form 组合形式commercial dictionary 商业词典common core vocabulary 基本词汇,共有核心词汇common usage 普通用法common word 普通词compact dictionary 缩印词典compact edition 缩印版comparative lexicography 比较词典学compilation (词典)编纂compiler 编纂者compiler perspective编篡者视角complementaries互补反义词complete antonym完全反义词complete synonym完全同义词complex word复杂词componential analysis成分分析,义素分析composition合词法compound复合词compound word复合词,合成词compounding复合构词法comprehensive dictionary详解词典computational lexicography计算词典学computer lexicography计算机词典学conceptual connection概念联系conceptual dictionary概念词典conceptual meaning概念意义concise dictionary简明词典concordance语词索引confrontationist linguistics对照语言学conjunct 连接性副词connotation隐含意义;附加意义;内涵connotative meaning内涵意义connotative style咨询文体content word实义词context语境context definition语境释义法context of situation言语环境,情景语境contextual definition语境释义contextual function语境功能contextual meaning语境意义contextual theory语境理论contract word缩写词contracted form,contraction缩写contradictory term 对立性反义词contrast对称词contrastive analysis 对比分析contrastive linguistics 对比语言学conversion词类转化法conversive换位反义词cooccurrence 同现cooccurrence relation同现关系cooccurrence restriction同现限制cooccurrence-range搭配cooccurrent meaning共现意义copying in dictionaries词典抄借copyright版权core group核心词群core sense核心义项core vocabulary核心词汇core word核心词co-reference互见corpus语料库corpus composition语料库的组成corpus correction语料库矫正corpus-orient lexicography语料库技术词典学correction矫正correctness正确性count noun可数名词countable noun可数名词coverage覆盖度creole混合语creolized language混合语cross reference互参,互见,交互参照cross-classification交叉结构cross-reference structure参见结构cryptogram密码cryptology隐语cultivated spoken language有教养的口头语言cultivated usage优雅用法cultural borrowing文化借用cultural context文化环境cultural dictionary文化词典cultural guide文化向导cultural lexicography文化词典学cultural-bound lexical item文化局限词汇项cultural-bound term(word) 文化局限词cultural-loaded expression文化含义词cultural-specific vocabulary文化局限词汇culture- specific vocabulary文化局限词汇cuneiform,cuneiform writing楔形文字curtailed word缩短词cyclopedia百科全书cynicism挖苦语dagger剑号(┼)data bank数据库database数据库,资料库databases & audio-visual materials数据库与声像资料data-processing资料加工,数据处理dead affix废弃的词缀,废缀dead conjugation已经不用的词形变化形式dead language死语言dead metaphor死隐语dead word废词deadjective suffix附加于形容词的后缀deadjective verb来自形容词的动词declension(静词)词尾变化decode解码decoding dictionary解码词典decoding function 解码功能de-etymologization词源中断definiendum被下定义的词语,被释词目definiens(pl.definientia)下定义用的词语,释义defining dictionary释义词典defining vocabulary(DV)定义用词汇,定义用词汇总表definition释义,定义deflexion词尾消失degeneration of meaning词义的降格deictic field指示范围denominal adjective 来自名词的形容词denominal noun 来自名词的名词denominal suffix 附加于名词的后缀denominal verb来自名词的动词denotation所指意义,字面意义denotational meaning指称意义,所指意义denotative meaning外延意义denotatum(pl.denotata)所指客观对象density of entries词条密度derivation派生词;派生法derivation by zero suffix零位后缀派生法derivational affix派生词缀derivational antonym派生反义词derivational compound派生复合词derivational morpheme派生形素derivational suffix派生后缀derivative派生词derived form源出(<)derived sense派生义项derived stem派生词干deriving form派生形式derogatory贬损的,贬义的description描写descriptive dictionary描写性词典descriptive equivalent描写性对应词descriptive function描写功能descriptive trend描写性倾向descriptivism描写主义descriptor系索词,标志词designate定义,所指内容的组成designation指称意义designative word指称词designatum(pl.designata)所指内容desk dictionary案头词典desktop e-dictionary桌面电子词典desktop electronic-dictionary桌面电子词典deterioration of meaning词义降格,词义贬降determiner 限定词deverbal adjective来自于动词的形容词deverbal noun来自于动词的名词deverbal suffix附加于动词的后缀diachronic approach历时角度diachronic dictionary历时词典diacritic变音符,附加符号diacritic sign附加符号diacritical mark变音符,附加符号diacritical marking符号标音法dialect dictionary方言词典dialect lexicography方言词典学dialectism方言词语diction措词dictionary词典,字典dictionary awareness词典意识dictionary criticism词典批评dictionary culture词典文化dictionary family词典家族dictionary for comprehension理解型词典dictionary for production生成型词典dictionary for speakers of the source language源语用户词典dictionary for speakers of the target language目的语用户词典dictionary for translation翻译词典dictionary form词典形式dictionary history词典史dictionary lookup词典查检dictionary maker词典编篡者dictionary making词典编篡dictionary meaning词典意义dictionary of proverbs谚语词典dictionary of the literary language书面语词典dictionary of the spoken language口语词典dictionary proper正文部分dictionary research词典研究dictionary review词典评论dictionary structure词典结构dictionary text词典语篇dictionary typology词典类型学dictionary use词典使用dictionary user词典使用者dictionary with bilingual双解词典dictionary word词典词didactic function教导功能differentia specifica属差differentia (pl. differentiae)种差differential dictionary区别性词典differential linguistics区别语言学diglossia双语现象diglottic level双语现象的变体diminutive指小(词)diminutive suffix指小后缀directories of agencies机构指南disambiguation消除歧义discourse meaning话语意义discrimination辨异,词义辨析disjunct分离性副词distinctive feature区别性特征distributional analysis分布分析法ditransitive verb双宾语动词ditto“同上”号(″)division into syllables分音节DJ丹尼尔▪琼斯标音法domesticated word归化词dominant sense主要意义double brackets双方括号double check双核对号(√)double dagger 双剑号(╪)double scale组成一对的同义词double virgules双斜线号(//)doublet同源异体字echoic word拟声词edition版本editor编辑EFL lexicography英语作为外语的学习词典学electronic bilingual dictionary电子双语词典electronic dictionary电子词典electronic lexicography电子词典学elevation of meaning词义的扬升ellipsis省略号(…)ELT lexicography英语教学词典学emotive meaning 情感意义emotive overtone感情色彩empirical ordering经验排列enclitic后接词encode编码,组码encoding dictionary编码词典encoding function编码功能encyclopedia百科全书encyclopedia definition百科释义encyclopedic dictionary百科词典encyclopedic entry百科条目encyclopedic matter百科信息English Philological Society英语语文协会entailed meaning蕴含意义entry条目,词条entry pane条目窗entry word词目ephemeral word瞬息新词equivalent对应词equivalent analogue等值的对应体ESL(English as second language)作为第二语言的英语ethnolinguistic bilingual dictionary人类语言学双语词典etymological dictionary词源词典etymology词源(学)euphemism委婉语everyday expression日常用语example,example-sentence例句exclamation mark感叹号exegetic dictionary注释词典exemplification括注法explanatory definition解说式释义explanatory equivanlent解释对等词explanatory gloss解释性说明explicit cross-reference明示互参extended sense引申意义extension外延extension of meaning语义扩大extinct language 死语,死亡语extralinguistic context 语言外语境familiar style非正式文体family of languages 语系field场field theory 词场理论field label学科标注figurative meaning比喻意义figurative speech比喻语figurative-metaphorical比喻隐喻的figure of speech修辞格file资料档案files of citation引例档案filler-in填空词fist参见号fixed accent固定重音fixed collocation固定搭配fixed phrase 固定短语fixed stress固定重音fixed word-combination固定词组fixed word-order固定词序folk definition通俗释义folk etymology民俗词源,俗词源学folk speech民间语folk usage通俗用法folk-etymological民俗词源的forcing example强迫性例证foreign affix外来词缀foreign learner’s dictionary外国学习者词典foreign word外来词,外语词foreignism外来词语form of address称呼形式form speech正式言语form style正式文体form word 形式词format板式,开本formative构词成分formulaic definition程式释义four-letter word四字母语,粗俗词语frame(structure)框架(结构)free combination自由组合free morpheme自由语素free root自由词根free translation意译free variant自由变体free variation自由变异free word order自由词序French quotes法文引号,书名号frequency词频frequency word-book频率词表front and back clipping对词的首部与尾部的缩略front clipping对词的首部的缩略front matter前页部分front matter ,front page material前页,前页材料,(正文前的)材料frozen expression定型短语frozen style拘谨文体full homonym实足同形同音异义词full word实词,完全词function word功能词,虚词functional equivalent功能等值functional label功能标注functional language功能语言functional marker功能标记functional typology功能分类法functional varieties功能变体functional word功能词,虚词fuzzy terms模糊词语gazetteer地名索引,地名词典gem dictionary珍宝词典,精选词典general concordance普通词表general dictionary通用词典;普通词典generalization of meaning词的普遍化general-purpose bilingual dictionary综合性双语词典,通用双语词典general-purpose dictionary综合性(语文)词典general-purpose English dictionary综合性英语词典generative dictionary生成词典generic term类属词genus总属genus proximum近种geographical dictionary地理词典geographical entry地理条目geographical sources地理资料ghostword鬼词,别字giving synonyms同义词释义gleaning补遗gloss夹注,注释glossary注释词表,术语汇编glueword连接词gobbledygook官样文章Gothic writing哥特体字,黑体字governed word受支配词governing word支配词government publications政府出版物gradable adjective等级形容词grammar语法grammatical bound meaning受语法限制的意义grammatical coding语法代码grammatical collocation语法搭配grammatical context语法语境grammatical function语法功能grammatical information语法信息grammatical labeling语法代码grammatical marker语法标记grammatical motivation语法理据grammatical pattern语法模式grammatical sequence语法序列grammatically-partial word虚词graphic illustration插图,图解graphic substance形的实体graphic symbol书写符号guide word眉题,向导词habitual collocation习惯性搭配habitual co-occurrence习惯性同现handheld electronic dictionary掌上电子词典haplography掉字,漏写hard word难词head phrase词条headword词目heavy-duty word重负荷词hesitation-form犹豫形式hierarchical structure层级结构hierarchical system层级系统hieroglyphic writing象形文字high word 高位词historical comparative linguistics历史比较语言学historical dictionary(按历史原则编写的)历史词典historical lexicography历史词典学historical ordering 历史排列historical principle历史性原则historism历史词语homograph同形异义词homography同形异义homonym同音异义词,同形异义词homonymy同音异义,同形异义homophone mark同音号humorous幽默的hybrid混合词hybrid language 混杂词hybrid word混合词,杂交词hyperonym总义词hypersemanticized discourse超语义化的说法hyphen连字符;隔音号hyphenated name连号hyphenation断词hyphenation routine连字法规则hypocoristic form爱称形式hypocoristic word爱称词hyponym下义词hyponymy下义关系identifying indication识别性说明ideogram表意文字ideographic symble表意符号ideographic writing表意文字ideography表意文字研究ideographical dictionary概念词典,义类词典ideographical function意识功能idiom习语,成语idiomatic expression习惯性词语idiomatic usage习惯用法idiomatics习语学,成语学illiterate language 文盲用语illustration插图,例证illustrative citation例证,引证illustrative example说明性例句;例证illustrative quotation例证imitation binding仿古装帧imitative semantic change语义变化模仿immediate postpositive直接后置形容词implicative method隐含法implicit cross-reference暗示互参impolite word不礼貌用语imposition强加inappropriate不得体的indention缩格index索引index verborum词语出处索引indexation索引检索indexes & abstracts索引与摘要indexing language索引语言infix中缀inflected language屈折语inflection屈折变化inflectional affix屈折词缀inflectional language屈折语inflectional morpheme屈折词素inflectional variant屈折变体inflective language屈折语inflexion 屈折变化inflexional ending词尾屈折inflexional language屈折语inflexional series屈折序列inflexional suffix屈折后缀informal style非正式文体informant语言调查合作人information card背景资料卡information category信息范畴information retrieval language情报检索语言informative dictionary知识性词典initial inflexion开首屈折initial part词首部分initialism首字母连写词inkhorn term学究气的用语innovation新造词insertible equivalent可插入对应词instruction manual说明手册instrument language古今语言instrumental case工具格intensifier强调成分interactive dictionary交互词典interface language接口语言interjection感叹词interlingual dictionary语际词典interlingual interference语际障碍interlingual purism语际语言纯正主义International Phonetic Alphabet (IPA)国际音标,国际音标注音法internationalism国际词intimate style亲昵语体intralingual purism内部语言纯正主义introspective example自省性例证invented example自造词irregular inflection不规则屈折形式italic斜体字italic bold-face type斜黑体jargon行话KK KK音标koine共通语,共同语language for specific purposes专门用途语言language notes语言说明language transfer语言迁移language typology语言类型学langue 语言,语言系统latent word潜在词Latinism拉丁词语learned word文言词learner’s dictionary学生词典lemma词目lemma unit词目单位letter-by-letter arrangement纯字母排列法lexeme词汇单位;词位,词素,词项lexical词汇的,语词的lexical ambiguity词汇歧义;词汇模糊性lexical collocation词汇搭配lexical context词汇语境lexical density词汇密度lexical entry词项,语词条目lexical equivalent词义对应词lexical expression词汇表达方式lexical field词汇场lexical gap词汇空缺lexical grammar词汇语法lexical item词汇单位;词位,词素,词项lexical meaning词汇意义lexical set 词群,词集lexical stock词汇总库lexical unit词汇单位lexical word词汇词lexicographer词典学家,词典编篡者lexicographese词典用语lexicographic context词典语境lexicography词典学,词典编篡,词典编篡学lexicology词汇学lexicon词典(尤指古代语言的词典);词库ligature连音符lingua franca混合语,通用语,交际语linguistic context语言语境linguistic dictionary语文词典linguistic matter语言信息linguistic typology硬译分类学linguistics across culture跨文化语言学literal error排字错误,印刷错误literal meaning字面意义literal translation直译,硬译literary书面语literary language文学语言literary standard文学标准语literary word书面词语live suffix活后缀living affix现在通用的词缀living conjugation“活”的(词形)变化living language现用语言,活语言living word现在通用的词汇loan blend借词混成词,借词拼缀词loan shift转用借词loan translation翻译借词,仿译词loan word借词,外来词local dialect地方方言locution措词logical definition逻辑式定义logical ordering逻辑排列logographic lexicon字典logography速记符long vowel长元音lower-case letter小写字母(印刷用语)LSP lexicography专业英语词典学machine-readable dictionary机读词典machine-aided lexicography机助词典学macro-lexicography宏观词典学macron长音符(加在元音上的“-”)macrostructure宏观结构made-up example自造例main word主导词majuscule大写字母makeshift language代用语言malformation构词错误,误构manual手册maps & atlases地图与地图集marginal meaning外延意义mark,marker标记master index总索引meaning意义meaning discrimination词义辨析meaning-oriented principle意义中心原则means of access检索途径measure adjective度量形容词measure noun度量名词mechanical dictionary电脑词典mediostructure中间结构medium dictionary中型词典megastruture整体结构metalanguage元语言metalexicography元词典学metaphor隐喻metaphoric meaning比喻意义,喻义metaplasm词形变异methodology方法论metonymy换喻,转喻microcontext微观语境microglossary微词典microlexicography微观词典学microstructure微观结构middle matter正文部分midline dot分节点mixed language混合语modal verb情态动词mode式momentary event verb瞬间动作动词monolingual dictionary单语词典monolingual lexicography单语词典学monosemic word单义词monosemy单义性moribund language垂死语言morpheme语素morpheme word语素词morphemic arrangement语素顺序排列morphemic dictionary词素词典morphemical mark形态符号morphology词法morphology label词法标注mother tongue negative transfer母语负迁移motional verb动作动词motivated word有理据的词motivation of word词的理据multi-lingual dictionary多语词典multilingual lexicography多语词典学multi-media dictionary多媒体词典multiword lexical unit多单词词位,复词词汇单位narrow Romic严式罗密克音标narrow transcription严式音标,窄式记音法narrowed meaning狭义narrowing词义缩小native affix本族词缀native language本族语native speaker说本族语的人native speaker’s dictionary本族语词典native word本族词natural language自然语言near-synonym近义词negative transfer负迁移neoclassic formation新古典词的构词法neoclassic word新古典词neologism新词nest(ing)派生词群nest-alphabetic method词集字母排列法nil-equivalent零对应词,无对应词noetics义位学nomenclature术语集nominal definition名目定义nonce-word临时词non-designative非指称词non-echoic word非拟声词non-gradable adjective非等级形容词non-historical dictionary非历史词典non-insertible equivalent非插入对应词non-productive无构词能力的non-restrictive collocation非限制性搭配nonstandard非标准(用语)normal dictionary传统词典normative dictionary规范词典normative lexicography规范性词典学notional passive意义上被动notional system概念系统notional word实义词noun名词noun adjunct附加名词noun cluster名词词组noun compound复合名词noun of multitude群体名词noun-drivative派生名词now rare目前少用nuance细微差别numbered clause分节号(§)numeral数词object宾语object language目的语,对象语言obsolescent陈旧的obsolete已废的obsolete affix废缀obsolete word 旧词obsoletism 已废弃的词语one-phrase definition单一短语释义法one-to-one correspondence一一对应one-to-one equivalent一一对等on-line dictionary在线词典,网络词典onomasiological gap词汇空缺;名称空缺onomasiology定名学onomasticon专名词典onomatopoeic word拟声词open combination开放型组合open corpus开放式语料库open-class words开放性词类opposite meaning对立意义optional variant随意变体oratorical style演说文体ordinal number序数词ordinals序数词orthographic criterion书写标准orthographic syllable拼法音节orthography正字法,拼写法ostensive definition直观定义ostensive definition直观释义法output language输出语outside matter正文外部分overall-descriptive dictionary全面描写词典over-defining过度释义P marker短语标记pagination页码检索paper dictionary纸质词典paradigm(名词、动词等的)词形变化表paragraph分节号(§);段落;段落号(▪)parallel bars平行号(║)parent language 母语,源语parentheses圆括号parole言语paronym形似词partial conversion部分词类转化partial equivalent部分对应词partial homonym部分同音同形异义词participle分词particle小品词,语助词parts of speech词类parts-of-speech label词性标注passive dictionary被动型词典,消极词典patois土话pedagogical dictionary教学词典pedagogical lexicography教学词典学pejorative轻蔑词pejorative epithet表贬损的修饰语pejorative suffix贬义后缀perfect antonym完全反义词perfect equivalence完全对等perfect equivalent完全对等词perfect homonym完全同音同形异义词period句号period dictionary断代词典period lexicography断代词典学peripheral kinds of vocabulary边缘性词汇peripheral language外围语periphrastic definition迂回定义peroration of meaning词义的降格personal suffix人称后缀phantom word幻象词phenomenological typology现象分类法philological bilingual dictionary语文学双语词典philological dictionary语文词典philology语文学phoneme音位,音素phonemic notation音标,音位标音法phonemic transcription音位标音phonemic word音位词phonemics音位学,音素学phonetic acronym语音缩写词phonetic alphabet音标,语音字母phonetic change语音演变phonetic convergence音变的汇合phonetic hyphen隔音号(-)phonetic motivation拟声理据phonetic pattern语音模式phonetic spelling表音拼写法phonetic syllable语音音节phonetic symbol音标,音符phonetic transcription注音,标音法phonetic writing拼音文字phoneticism音标拼词法phonographic alphabet表音字母phonology音系学,音位学phrasal verb短语动词phrase短语,词组phrase clipping短语略写phrase idiom惯用短语phrase marker短语标记phraseological dictionary熟语词典phraseological lexicography熟语词典学phraseology熟语,熟语集phrasing措词pictograph象形文字pictographic writing图画文字pictorial arrangement图式顺序排列pictorial dictionary图画词典pictorial illustration插图pidgin混杂语pidgin English洋泾浜英语plurality复数性,多重性plurilingual多语种的plurilingualism多语制pocket dictionary袖珍词典pocket electronic dictionary掌上电子词典poetic word诗歌用语poetical archaic word诗用古词poetry诗体poetism诗体词语polite formulas礼貌套语polylingual多语种的polylingual dictionary多语种对照词典polylingualism多语制polyseme,polysemous word多义词(现象)polysemy多义现象,一词多义polysyllable多音节词polytechnic dictionary科技词典popular etymology俗词源学popular language俗语popular word俗语词portmanteau word紧缩词post-modifier后置修饰语postpositive后置形容词pragmalinguistics语用语言学pragmatic analysis语用分析pragmatic equivalent语用对应词pragmatic failure语用失误pragmatics语用学predeterminer前置限定词predicative表语preface序言prefix前缀prefixation加前缀premodifier前置修饰语prescriptive规范性的prescriptive dictionary规范词典prescriptive grammar规定语法prescriptive lexicography规定性词典学prescriptive trend规定性倾向prescriptivism规定主义present participle现在分词presentational affix表义词缀presentational or tectonic typology表述(或构造)分类法primary accent主重音primary linguistic data第一手语言资料primary meaning本义primitive原始词principal language主体语言print dictionary印刷型词典printing印刷proclitic后接发音词productive activity(说、写等)产出性活动productive affix有派生能力的词缀,派生词缀productive bilingual dictionary能产性双语词典productive dictionary产出型词典productive function产出功能productivity能产性pronominal adjective代词性形容词pronouncing dictionary发音词典pronunciation key发音表prototype原型proverb谚语provincial standard地方标准punctuation mark标点符号punning双关语purism语言纯正主义purrword褒词quadrilingual dictionary四语词典quasi-normative bilingual dictionary准规范化双语词典quasi-synonym准同义词quasi-synoymous word准同义词questionnaire问卷,调查表quotation书证quotation mark引号radiation(词义的)辐射radical词根,部首radical flexion词根屈折radical language词根语radical sense原始义range of application使用范围range of collocation搭配范围rare罕用reading programme阅读项目real definition真实定义realization体现关系Received Pronunciation (RP)标准发音receptive activity接收活动receptive function接收功能receptor language接收语reciprocal dictionary互补词典reciprocal relation相互关系reduced entry减缩词条reduplication重叠reduplicative word重叠词reference 参见reference book工具书reference dictionary查考型词典reference matter检索信息reference mark检索符号reference need检索目的reference skill检索技巧reference unit检索单位referent所指事物,词目所指的对象referential definition所指释义referential meaning information所指意义referential pragmatics指代语用学referential symbolism所指符号refinement修饰reflected meaning发射意义regional word地区性词regionalism区域词语register域register label语域标注relational word关系词relative synonym相对同义词,近义词reroute重新查找respelling schemes重拼法respelling system重拼发音符号系统restricted language限制性语言restriction of meaning词义的限制restrictive collocation限制性搭配reverse dictionary逆序词典rheme述位rhyming dictionary音韵词典Roman type正体字root词根root antonym词根反义词root inflexion词根屈折root form词根形式,根式round brackets圆括号runic writing北欧古代文字running head向导词run-on (entry)副词目,内词条sandhi连读变音scholarly dictionary学术词典schoolboy slang学生俚语scientific terminology科技术语search检索,搜索searching window检索窗secondary accent次重音,次重音号secondary compound二次复合词secondary derivative次派生词secondary language第二语言secondary meaning次要意义secondary morpheme-word次语素词secondary phoneme次音位secondary stress次重音segmental dictionary部分语词词典,特种语词词典selection of entries (articles)选条selection of head characters选字selection of headwords选词selection preference选择倾向selection restriction选择限制sell-aware form自觉形式semantic affinity语义一致semantic arrangement语义顺序排列semantic coincidence语义重合semantic component语义成分semantic condensation语义缩合semantic contradiction语义矛盾semantic contrast语义对比semantic criterion语义标准semantic dictionary主题词典semantic divergence词义分化semantic extension语义扩展semantic factor语义因素semantic field语义场semantic function语义功能semantic glosses语义注释semantic inclusion语义包容semantic intersection语义交叉semantic marker语义标记semantic motivation语义理据semantic properties语义特征semantic prototype model语义原型模式semantic shift语义演变semantics语义学sememe义素semi-bilingual半双解semicolon分号semiology,semiotics符号学semi-unabridged dictionary半足本词典sense义项sense discrimination义项区分sense relation义项关系sentence connector连接词sentence idiom成语性句子sentence pattern句型sentence substitute替代词。
如何将语料库中的词语和短语进行对齐,以帮助机器翻译系统进行翻译摘要:随着机器翻译技术的发展,研究人员越来越依赖于庞大的语料库来训练和提升翻译系统的性能。
然而,语料库中的词语和短语往往存在着不完全对齐的情况,这给机器翻译的质量带来很大挑战。
本文将介绍如何将语料库中的词语和短语进行对齐,以帮助机器翻译系统实现更准确、流畅的翻译。
引言:语言是人类思维和交流的重要工具,而机器翻译则是帮助人们进行语言交流的关键技术之一。
然而,不同语言之间的差异和复杂性使机器翻译面临很多挑战。
为了解决这些问题,研究人员通过构建庞大的语料库来训练和提升机器翻译系统的性能。
然而,语料库中的词语和短语通常存在着不完全对齐的情况,这对机器翻译的质量带来了很大的影响。
一、语料库中的词语和短语对齐问题在构建用于训练机器翻译系统的语料库时,常常需要从不同来源的文本中收集大量的句对数据,包括源语言文本和目标语言文本。
然而,语言之间的差异和表达方式的多样性导致了对齐问题的出现。
1. 词汇差异:不同语言之间的词汇差异是机器翻译中常见的挑战之一。
同一个概念在不同语言中可能有不同的表达方式,而且词语的顺序也可能不同。
当词语之间存在着不完全对应关系时,机器翻译系统很难准确地翻译文本。
2. 短语结构差异:除了词汇上的差异外,不同语言的短语结构以及语法规则也存在差异。
例如,英语中的形容词通常出现在名词前,而法语中的形容词通常出现在名词后。
这种差异导致了短语之间的不完全对齐问题,给机器翻译带来了困难。
二、对齐方法与技术为了解决语料库中词语和短语对齐的问题,研究人员提出了许多方法和技术。
以下是几种常用的对齐方法:1. 基于规则的对齐方法:基于规则的对齐方法依赖于预定义的规则和词典来对齐词语和短语。
这些规则可以从语言学知识或专业人员的经验中获取。
例如,可以使用词性标注和句法分析等技术来辅助对齐。
虽然这种方法易于理解和实现,但对于复杂的语言对和文本结构,规则往往不够灵活和全面。