编译原理 第2章 文法和语言的基本知识
- 格式:ppt
- 大小:1014.50 KB
- 文档页数:99
编译原理的⽂法和语⾔总结与梳理梳理⽂法和语⾔的内容,理解与总结。
我们都知道,⼀种语⾔必定他的⽂法去描述,它的完整定义包括语法和语义两个⽅⾯。
语⾔和语法是指⼀组规则,⽤它可以形成和产⽣⼀个合适的程序。
⽬前⼴泛使⽤的是上下⽂⽆关⽂法,也就是⽤上下⽂⽆关⽂法作为程序设计的描述⼯具,⽐如⽤A:=B+C表⽰是⼀个合法的赋值语句,则A:=B+就不是合法的赋值语句。
什么是⽂法?⽂法相当于语⾔学(⼈类语⾔)中的语义分析,即分析⼀个句所表⽰的含义。
它是产⽣中间代码或⽬标代码的依据。
⽤EBNF(EBNF是⼀种称为扩展巴克斯范式的形式描述)表⽰就是:<句⼦> ::= <主语><谓语> <主语> ::= <代词>< 名词> <代词>::= 我 | 你 | 他 <名词>::= 王明 | ⼤学⽣ | ⼯⼈ | 英语 <谓语> ::= <动词><直接宾语> <动词> ::= 是 | 学习 <直接宾语> ::=<代词> |<名词>(1)⽂法的形式化定义: G=(V T , V N , P , S) V T:终结符集合,终结符是⽂法所定义的语⾔的基本符号,有时也称为token。
V N:⾮终结符集合,⾮终结符是⽤来表⽰语法成分的符号,有时也称为"语法变量",可以推出其它的语法成分P:产⽣式集合S:开始符号(2)符号串运算: 符号串的连接:εx=xε=x; 集合的乘积:AB={xy|x∈A,y∈B};{ε}A=A{ε}=A; 符号串的幂运算:x=abc,x^2=abcabc; 集合的幂运算正闭包A+与闭包A*:A*={ε}∪A+(3)⽂法分类:(4)语⾔的定义与运算 语⾔:在某⼀确定字母表上的特定符号串的集合。
空集ε,集合{ ε }也是符合此定义的语⾔。
第二章文法和语言本章讲述目前广泛使用的上下文无关文法。
即用上下文无关文法作为程序设计语言语法的描述工具。
阐明语法的一个工具是文法。
本章将介绍文法和语言的概念。
本章重点:上下文无关文法及其句型分析中的有关问题。
第一节文法的直观概念当我们表述一种语言时,无非是说明这种语言的句子,如果语言只含有有穷多个句子,则只需列出句子的有穷集就行了,但对于有无穷句子的语言来讲,存在着如何给出它的有穷表示的问题。
以自然语言为例,人们无法列出全部句子,但是人们可以给出一些规则,用这些规则来说明(或者定义)句子的组成结构,比如:“我是大学生”。
是汉语的一个句子。
汉语句子可以是由主语后随谓语而成,构成谓语的是动词和直接宾语,我们采用EBNF来表示这种句子的构成规则:〈句子〉∷=〈主语〉〈谓语〉〈主语〉∷=〈代词〉|〈名词〉〈代词〉∷=我|你|他〈名词〉∷=王明|大学生|工人|英语〈谓语〉∷=〈动词〉〈直接宾语〉〈动词〉∷=是|学习〈直接宾语〉∷=〈代词〉|〈名词〉“我是大学生”的构成符合上述规则,而“我大学生是”不符合上述规则,我们说它不是句子。
这些规则成为我们判别句子结构合法与否的依据。
一旦有了一组规则以后,我们可以按照如下方式用它们去推导或产生句子。
我们开始去找∷=左端的带有〈句子〉的规则并把它表示成∷=右端的符号串,这个动作表示成:〈句子〉⇒〈主语〉〈谓语〉,然后在得到的串〈主语〉〈谓语〉中,选取〈主语〉或〈谓语〉,再用相应的规则∷=右端代替之。
比如,选取了〈主语〉,并采用规则〈主语〉∷=〈代词〉,那么得到:〈主语〉〈谓语〉⇒〈代词〉〈谓语〉,重复做下去,我们得到句子:“我是大学生”的全部动作过程是:〈句子〉⇒〈主语〉〈谓语〉⇒〈代词〉〈谓语〉⇒我〈谓语〉⇒我〈动词〉〈直接宾语〉⇒我是〈直接宾语〉⇒我是〈名词〉⇒我是大学生符号⇒的含义是,使用一条规则,代替⇒左边的某个符号,产生⇒右端的符号串。
显然,按照上述办法,不仅生成“我是大学生”这样的句子,还可以生成“王明是大学生”,“王明学习英语”,“我学习英语”,“他学习英语”,“你是工人”,“你学习王明”等几十个句子。
《编译原理》第2章文法和语言的形式定义编译原理是计算机科学中的一门重要课程,它研究的是将高级程序语言翻译成机器语言的方法和技术。
在编译原理中,文法和语言的形式定义是非常重要的概念,本文将围绕这个主题展开详细的讨论。
第2章《文法和语言的形式定义》主要介绍文法和语言的概念、应用及其形式定义的方法。
文法是描述语言结构和语法规则的形式化产物,而语言则是文法所描述的符号集合。
在编译原理中,我们需要通过形式定义的方式来描述和理解程序语言的结构和规则。
下面将对文法和语言的形式定义进行详细解释。
1.文法的定义文法是由产生式(Production)组成的四元组(G,N,P,S),其中:-G:表示文法-N:表示非终结符集合,即一组可以推导出或展开的符号。
-T:表示终结符集合,即不再进行推导或展开的符号。
-P:表示产生式规则集合,是一组指定如何生成目标符号串的规则。
-S:表示一个特殊的非终结符,称为开始符号或起始符号,表示文法的初始状态。
文法的定义可以采用两种形式:巴科斯-诺尔范式(Backus-Naur Form,BNF)和扩充背景文法表达式(Extended Backus-Naur Form,EBNF)。
BNF是最常用的文法定义方法,它使用产生式规则来描述语言的结构和规则。
2.产生式的定义产生式规定了如何用一个符号串替换或展开另一个符号串。
一个产生式由一个非终结符和一个由非终结符和终结符组成的字符串组成。
例如,产生式A->BC,表示用符号串BC替换非终结符A。
产生式可以有多个产生式体,每个产生式体之间使用“,”符号分隔。
例如,产生式A->B,C,表示非终结符A可以被替换成非终结符B或C。
产生式体中可以使用如下符号:-终结符:表示语法中不再与其他符号进行推导的符号,如数字、运算符、关键字等。
-非终结符:表示语法中可以被进一步推导的符号。
-空串:表示不产生任何字符的特殊终结符。
-ε:表示空串。
3.语言的定义语言是符合一些特定文法规则的所有符号串的集合。
编译原理文法和语言编译原理是计算机科学中非常重要的一个领域,它涉及到了计算机程序的设计、编写和执行过程中的一系列关键问题。
在编译原理中,文法和语言是两个核心概念,它们对于程序设计语言的理解和实现起着至关重要的作用。
首先,让我们来了解一下文法的概念。
文法是描述语言结构的形式化规则集合,它定义了一种语言的句子构成规则和语法结构。
在编译原理中,文法通常用来描述程序设计语言的语法结构,它可以帮助我们理解程序设计语言的语法规则,从而实现对程序代码的分析和理解。
文法通常包括终结符、非终结符、产生式和起始符号等要素。
终结符是文法中的基本符号,它代表了语言中的基本单词或标识符;非终结符是由终结符组成的集合,它代表了语言中的各种语法结构;产生式描述了非终结符如何由终结符和其他非终结符推导而来;起始符号是整个文法的起始符号,它代表了整个语言的起始符号。
在编译原理中,文法的设计和使用对于程序设计语言的编写和解释具有重要的意义。
一个好的文法可以帮助程序员更好地理解程序设计语言的语法规则,从而编写出更加健壮和高效的程序代码。
此外,文法还可以帮助编译器和解释器对程序代码进行分析和理解,从而实现对程序代码的编译和执行。
除了文法,语言也是编译原理中的一个重要概念。
语言是由一组句子构成的集合,它描述了一种特定的语法结构和语义含义。
在编译原理中,语言通常用来描述程序设计语言的语法和语义规则,它可以帮助我们理解程序设计语言的语法结构和语义含义,从而实现对程序代码的分析和理解。
在编译原理中,语言通常包括形式语言和自然语言两种类型。
形式语言是由一组形式化规则定义的语言,它通常用来描述程序设计语言的语法和语义规则;自然语言是由人类使用的自然语言,它通常用来描述程序设计语言的语义含义和程序逻辑。
形式语言和自然语言在编译原理中都扮演着非常重要的角色,它们可以帮助程序员更好地理解程序设计语言的语法和语义规则,从而编写出更加健壮和高效的程序代码。