Antlr4的分析错误处理
(前文通用型的中文编程语言探讨之一: 高考, 即使是这"第一步", 即使一切顺利达到列出的功能恐怕也需要个人数年的业余时间. 看到不少乎友都远更有资本和实力更快速地完成这一工程. 希望随时告知类似项目, 省得在下作无用功)
初步打算用Antlr4生成Java实现的词语法分析器, 主要是出于减少工作量的考虑, 但相应的需要深入学习这个工具. 根据至今看到的相关文档以及Antlr项目本身, 感觉还蛮实用, 可持续性也不错, 这些学习应该不会白费.
之前没有实验过它对错误语法的处理. 本文实现了编程语言试验之Antlr4+Java实现"圈2"的Visitor版本. 再添加了定制的词法语法错误处理. 源码在program-in-chinese/quan5
语法最简单, 只包含一个数:
grammar 圈5; 程序 : T数; T数 : [0-9]+ ; T空白 : [ \n\t]+ -> skip;
定制的语法错误处理器, 只有报告功能:
public class 语法错误监听器 extends BaseErrorListener { @Override public void syntaxError(Recognizer<?, ?> 识别器, Object 问题符号, int 行, int 字符在行中位置, String 信息, RecognitionException 例外) { List<String> 规则栈 = ((Parser) 识别器).getRuleInvocationStack(); Collections.reverse(规则栈); System.err.println("[语法错误] 规则栈: " + 规则栈); System.err.println("行" + 行 + "列" + 字符在行中位置 + "非法符号: " + 问题符号 + ". 原始原因:" + 信息); } }
下面是为语法分析器添加定制的错误分析(先除去默认的错误监听器):
圈5Parser 语法分析器 = new 圈5Parser(new CommonTokenStream(词法分析器)); 语法分析器.removeErrorListeners(); 语法分析器.addErrorListener(语法错误处理);
类似的也可以为词法分析器添加错误处理器. 其中为了取得错误的词, 没有找到现成的接口, 于是摘取了它源码一部分. 初步的感觉是, 虽然API不一定很完善(很有可能是自己不熟悉工具导致的), 但不少公开属性可以比较方便定制:
public class 词法错误监听器 extends BaseErrorListener { @Override public void syntaxError(Recognizer<?, ?> 识别器, Object 问题符号, int 行, int 字符在行中位置, String 信息, RecognitionException 例外) { Lexer 词法分析器 = (Lexer)识别器; // 摘自org.antlr.v4.runtime.Lexer.notifyListeners String 文本 = 词法分析器._input.getText(Interval.of(词法分析器._tokenStartCharIndex, 词法分析器._input.index())); String 错词 = 词法分析器.getErrorDisplay(文本); System.err.println("[词法错误] 行" + 行 + "列" + 字符在行中位置 + "错误词: " + 错词); } }
下面是一个语法有误的文件:
a
分析后的报错输出:
[词法错误] 行2列3错误词: a [语法错误] 规则栈: [程序] 行2列4非法符号: [@0,5:4='<EOF>',<-1>,2:4]. 原始原因:missing T at '<EOF>'
2018-01-11
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Antlr4实现数学四则运算
基本参考https://pragprog.com/book/tpantlr2/the-definitive-antlr-4-reference 一书"Building a Calculator Using a Visitor"一节, 仅添加了数学乘除法符号的支持(×÷). 比如下面的算式: 3×2+8÷4-2×4 源码仍在program-in-chinese/quan5 相比上一版本语法文件去除了空格定义. 需要深究的是优先级问题. 是否因为"表达式 运算符=('*'|'/'|'×'|'÷') 表达式"写在了前面才使得乘除法的优先级在语法分析时更高. 至此, 感觉Antlr语法文件对中文命名的支持还是不错的. 唯一需要权宜之计的就是Token(词)规则必须要大写开头, 因此采用了前缀"T"): grammar 圈5; 程序 : 表达式 ; 表达式 : 表达式 运算符=('*'|'/'|'×'|'÷') 表达式 #乘除 | 表达式 运算符=('+'|'-') 表达式 #加減 | T数 #数 ; T数 : [0-9]+ ; T加 : '+'; T減 : '-'; T乘 : '*'; T数乘...
- 下一篇
JavaScript 类继承
和其他功能一样,ECMAScript 实现继承的方式不止一种。这是因为 JavaScript 中的继承机制并不是明确规定的,而是通过模仿实现的。这意味着所有的继承细节并非完全由解释程序处理。作为开发者,你有权决定最适用的继承方式。 创建的子类将继承超类的所有属性和方法,包括构造函数及方法的实现。记住,所有属性和方法都是公用的,因此子类可直接访问这些方法。子类还可添加超类中没有的新属性和方法,也可以覆盖超类的属性和方法。 继承的方式: 对象冒充方式方式一 /*被继承类*/ function Animal_1(name) { this.name = name; this.printName = function () { console.log(this.name); } } function Person_1(name,age) { this.method1 = Animal_1; this.method1(name); this.age = age; this.printAge = function () { console.log(this.age); } } var o1 = ne...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
-
Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8编译安装MySQL8.0.19
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
推荐阅读
最新文章
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS关闭SELinux安全模块
- CentOS8编译安装MySQL8.0.19
- CentOS7设置SWAP分区,小内存服务器的救世主
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题