产生式和语法动作

在impl块内部将产生式和语义动作结合起来，以函数的形式编写代码，一个例子如下：

#[rule(Expr -> Sub Expr)]
#[prec(UMinus)] // 可选
fn expr_neg(s: Token, r: Expr<'p>) -> Expr<'p> {
  mk_expr(s.loc(), Unary { op: UnOp::Neg, r: Box::new(r) }.into())
}

以下几点需要注意：

这个生命周期'p是在impl处提供的，p是硬编码的，这意味着你把所有的'p都换成'a或者别的什么的，是不能work的。当然，我可以在过程宏中更加精细地提取代码中的这些信息，但是我想了一下，感觉收益明显小于付出，不多费事了
它虽然看起来是一个函数，但是其实不是，事实上它的函数体被提取出来当成代码段直接嵌在一个大函数中，所以不要在里面写return之类可以改变控制流的语句
lalr1会对参数进行类型检查，保证一个非终结符只能对应于一个类型，保证一个终结符一定对应一个Token类型，但是这检查完全是基于字符串比较的，并不会考虑任何rust层面的语义信息(如类型别名)，所以是有可能把两个相同的类型判定为不相同的。编写类型也可能带来相当程度的代码冗余，但是我认为这是有必要的，这是为了最大程度的保证生成器生成出来的代码可以被rustc编译。如果把生成器看成一个编译器，而把rustc的运行看成它的结果的运行，这就是在尝试把错误在编译期检查出来

java框架中采用SemValue作为lr分析中value stack的内容，SemValue就是一堆value stack中可能出现的类型组成的一个class，除了依赖于文档(不存在的)或者观察+记忆，使用者没办法知道哪个成员在这个产生式中是有效的，哪个成员是需要写入的，这带来了很大的不便，编译器也不能利用类型信息来检查代码。lalr1中的value stack是所有可能出现的类型的一个enum，在传递给语法动作前，会先取出栈中对应类型的成员(如果类型不对就panic!())，使用者可以很好地利用编译器的检查和ide的提示。我认为这个好处完全足以弥补编写类型带来的麻烦。

此外，对于产生式还可以添加一个额外的配置，#[prec(Term)]，这是指定这条产生式的优先级与终结符Term相同。具体的会在"解决冲突"一节描述。

Previousimpl块的可选属性 Next解决冲突

Last updated 6 years ago

Was this helpful?