当前位置：网站首页>【736. Lisp 语法解析】

【736. Lisp 语法解析】

2022-07-06 22:14:00 【千北@】

描述：

给你一个类似 Lisp 语句的字符串表达式 expression，求出其计算结果。

表达式语法如下所示:

表达式可以为整数，let 表达式，add 表达式，mult 表达式，或赋值的变量。表达式的结果总是一个整数。(整数可以是正整数、负整数、0)
let 表达式采用 "(let v1 e1 v2 e2 ... vn en expr)" 的形式，其中 let 总是以字符串 "let"来表示，接下来会跟随一对或多对交替的变量和表达式，也就是说，第一个变量 v1被分配为表达式 e1 的值，第二个变量 v2 被分配为表达式 e2 的值，依次类推；最终 let 表达式的值为 expr表达式的值。
add 表达式表示为 "(add e1 e2)" ，其中 add 总是以字符串 "add" 来表示，该表达式总是包含两个表达式 e1、e2 ，最终结果是 e1 表达式的值与 e2 表达式的值之和。
mult 表达式表示为 "(mult e1 e2)" ，其中 mult 总是以字符串 "mult" 表示，该表达式总是包含两个表达式 e1、e2，最终结果是 e1 表达式的值与 e2 表达式的值之积。
在该题目中，变量名以小写字符开始，之后跟随 0 个或多个小写字符或数字。为了方便，"add" ，"let" ，"mult" 会被定义为 “关键字” ，不会用作变量名。
最后，要说一下作用域的概念。计算变量名所对应的表达式时，在计算上下文中，首先检查最内层作用域（按括号计），然后按顺序依次检查外部作用域。测试用例中每一个表达式都是合法的。有关作用域的更多详细信息，请参阅示例。

示例 1：

输入：expression = "(let x 2 (mult x (let x 3 y 4 (add x y))))"
输出：14
解释：
计算表达式 (add x y), 在检查变量 x 值时，
在变量的上下文中由最内层作用域依次向外检查。
首先找到 x = 3, 所以此处的 x 值是 3 。

示例 2：

输入：expression = "(let x 3 x 2 x)"
输出：2
解释：let 语句中的赋值运算按顺序处理即可。

示例 3：

输入：expression = "(let x 1 y 2 x (add x y) (add x y))"
输出：5
解释：
第一个 (add x y) 计算结果是 3，并且将此值赋给了 x 。 
第二个 (add x y) 计算结果是 3 + 2 = 5 。

提示：

1 <= expression.length <= 2000
exprssion 中不含前导和尾随空格
expressoin 中的不同部分（token）之间用单个空格进行分隔
答案和所有中间计算结果都符合 32-bit 整数范围
测试用例中的表达式均为合法的且最终结果为整数

方法一：递归解析

对于一个表达式 expression，如果它的首字符不等于左括号 ‘ ( ’ ，那么它只能是一个整数或者变量；否则它是 let， add 和 mult 三种表达式之一。

定义函数 parseVar 用来解析变量以及函数 parseInt 用来解析整数。使用 scope 来记录作用域，每个变量都依次记录下它从外到内的所有值，查找时只需要查找最后一个数值。我们递归地解析表达式 expression。

expression 的下一个字符不等于左括号 ‘ ( ’
- expression 的下一个字符是小写字母，那么表达式是一个变量，使用函数 parseVar 解析变量，然后在 scope 中查找变量的最后一个数值即最内层作用域的值并返回结果。
- expression 的下一个字符不是小写字母，那么表达式是一个整数，使用函数 parseInt 解析并返回结果。
去掉左括号后， expression 的下一个字符是 ‘ l ’，那么表达式是 let 表达式。对于 let 表达式，需要判断是否已经解析到最后一个 expr 表达式。
- 如果下一个字符不是小写字母，或者解析变量后下一个字符是右括号 ‘ ) ’，说明是最后一个 expr 表达式，计算它的值并返回结果。并且我们需要在 scope 中清除 let 表达式对应的作用域变量。
- 否则说明是交替的变量 vi 和表达式 ei ，在 scope 将变量 vi 的数值列表增加表达式 ei 的数值。
去掉左括号后， expression 的下一个字符是 ‘ a ’，那么表达式是 add 表达式。计算 add 表达式对应的两个表达式 e1 和 e2 的值，返回两者之和。
去掉左括号后，expression 的下一个字符是 ‘ m ’，那么表达式是 mult 表达式。计算 mult 表达式对应的两个表达式 e1 和 e2 的值，返回两者之积。

代码：

class Solution {
    
private:
    unordered_map<string, vector<int>> scope;

public:
    int evaluate(string expression) {
    
        int start = 0;
        return innerEvaluate(expression, start);
    }

    int innerEvaluate(const string &expression, int &start) {
    
        if (expression[start] != '(') {
     // 非表达式，可能为：整数或变量
            if (islower(expression[start])) {
    
                string var = parseVar(expression, start); // 变量
                return scope[var].back();
            } else {
     // 整数
                return parseInt(expression, start);
            }
        }
        int ret;
        start++; // 移除左括号
        if (expression[start] == 'l') {
     // "let" 表达式
            start += 4; // 移除 "let "
            vector<string> vars;
            while (true) {
    
                if (!islower(expression[start])) {
    
                    ret = innerEvaluate(expression, start); // let 表达式的最后一个 expr 表达式的值
                    break;
                }
                string var = parseVar(expression, start);
                if (expression[start] == ')') {
    
                    ret = scope[var].back(); // let 表达式的最后一个 expr 表达式的值
                    break;
                }
                vars.push_back(var);
                start++; // 移除空格
                int e = innerEvaluate(expression, start);
                scope[var].push_back(e);
                start++; // 移除空格
            }
            for (auto var : vars) {
    
                scope[var].pop_back(); // 清除当前作用域的变量
            }
        } else if (expression[start] == 'a') {
     // "add" 表达式
            start += 4; // 移除 "add "
            int e1 = innerEvaluate(expression, start);
            start++; // 移除空格
            int e2 = innerEvaluate(expression, start);
            ret = e1 + e2;
        } else {
     // "mult" 表达式
            start += 5; // 移除 "mult "
            int e1 = innerEvaluate(expression, start);
            start++; // 移除空格
            int e2 = innerEvaluate(expression, start);
            ret = e1 * e2;
        }
        start++; // 移除右括号
        return ret;
    }

    int parseInt(const string &expression, int &start) {
     // 解析整数
        int n = expression.size();
        int ret = 0, sign = 1;
        if (expression[start] == '-') {
    
            sign = -1;
            start++;
        }
        while (start < n && isdigit(expression[start])) {
    
            ret = ret * 10 + (expression[start] - '0');
            start++;
        }
        return sign * ret;
    }

    string parseVar(const string &expression, int &start) {
     // 解析变量
        int n = expression.size();
        string ret;
        while (start < n && expression[start] != ' ' && expression[start] != ')') {
    
            ret.push_back(expression[start]);
            start++;
        }
        return ret;
    }
};

执行用时：0 ms, 在所有 C++ 提交中击败了100.00%的用户
内存消耗：8.5 MB, 在所有 C++ 提交中击败了75.73%的用户
复杂度分析
时间复杂度： O(n)，其中 n 是字符串 expression 的长度。递归调用函数 innerEvaluate 在某一层调用的时间复杂度为 O(k)，其中 k 为指针 start 在该层调用的移动次数。在整个递归调用过程中，指针 start 会遍历整个字符串，因此解析 expression 需要 O(n)。
空间复杂度： O(n)。保存 scope 以及递归调用栈需要 O(n) 的空间。

方法二：状态机

代码：

enum ExprStatus {
    
    VALUE = 0, // 初始状态
    NONE,      // 表达式类型未知
    LET,       // let 表达式
    LET1,      // let 表达式已经解析了 vi 变量
    LET2,      // let 表达式已经解析了最后一个表达式 expr
    ADD,       // add 表达式
    ADD1,      // add 表达式已经解析了 e1 表达式
    ADD2,      // add 表达式已经解析了 e2 表达式
    MULT,      // mult 表达式
    MULT1,     // mult 表达式已经解析了 e1 表达式
    MULT2,     // mult 表达式已经解析了 e2 表达式
    DONE       // 解析完成
};

struct Expr {
    
    ExprStatus status;
    string var; // let 的变量 vi
    int value; // VALUE 状态的数值，或者 LET2 状态最后一个表达式的数值
    int e1, e2; // add 或 mult 表达式的两个表达式 e1 和 e2 的数值

    Expr(ExprStatus s) {
    
        status = s;
    }
};

class Solution {
    
private:
    unordered_map<string, vector<int>> scope;

public:
    int evaluate(string expression) {
    
        vector<vector<string>> vars;
        int start = 0, n = expression.size();
        stack<Expr> s;
        Expr cur(VALUE);
        while (start < n) {
    
            if (expression[start] == ' ') {
    
                start++; // 去掉空格
                continue;
            }
            if (expression[start] == '(') {
    
                start++; // 去掉左括号
                s.push(cur);
                cur = Expr(NONE);
                continue;
            }
            string token;
            if (expression[start] == ')') {
     // 本质上是把表达式转成一个 token
                start++; // 去掉右括号
                if (cur.status == LET2) {
    
                    token = to_string(cur.value);
                    for (auto var : vars.back()) {
     // 清除作用域
                        scope[var].pop_back();
                    }
                    vars.pop_back();
                } else if (cur.status == ADD2) {
    
                    token = to_string(cur.e1 + cur.e2);
                } else {
    
                    token = to_string(cur.e1 * cur.e2);
                }
                cur = s.top(); // 获取上层状态
                s.pop();
            } else {
    
                while (start < n && expression[start] != ' ' && expression[start] != ')') {
    
                    token.push_back(expression[start]);
                    start++;
                }
            }
            switch (cur.status) {
    
                case VALUE:
                    cur.value = stoi(token);
                    cur.status = DONE;
                    break;
                case NONE:
                    if (token == "let") {
    
                        cur.status = LET;
                        vars.emplace_back(); // 记录该层作用域的所有变量, 方便后续的清除
                    } else if (token == "add") {
    
                        cur.status = ADD;
                    } else if (token == "mult") {
    
                        cur.status = MULT;
                    }
                    break;
                case LET:
                    if (expression[start] == ')') {
     // let 表达式的最后一个 expr 表达式
                        cur.value = calculateToken(token);
                        cur.status = LET2;
                    } else {
    
                        cur.var = token;
                        vars.back().push_back(token); // 记录该层作用域的所有变量, 方便后续的清除
                        cur.status = LET1;
                    }
                    break;
                case LET1:
                    scope[cur.var].push_back(calculateToken(token));
                    cur.status = LET;
                    break;
                case ADD:
                    cur.e1 = calculateToken(token);
                    cur.status = ADD1;
                    break;
                case ADD1:
                    cur.e2 = calculateToken(token);
                    cur.status = ADD2;
                    break;
                case MULT:
                    cur.e1 = calculateToken(token);
                    cur.status = MULT1;
                    break;
                case MULT1:
                    cur.e2 = calculateToken(token);
                    cur.status = MULT2;
                    break;
            }
        }
        return cur.value;
    }

    int calculateToken(const string &token) {
    
        if (islower(token[0])) {
    
            return scope[token].back();
        } else {
    
            return stoi(token);
        }
    }
};

执行用时：0 ms, 在所有 C++ 提交中击败了100.00%的用户
内存消耗：7.3 MB, 在所有 C++ 提交中击败了93.20%的用户
复杂度分析
时间复杂度： O(n)，其中 nn 是字符串 expression 的长度。状态机解析会遍历整个字符串，因此需要 O(n) 的时间。
空间复杂度： O(n)。保存状态的栈以及作用域变量都需要 O(n) 的空间。
author：LeetCode-Solution

原网站

版权声明
本文为[千北@]所创，转载请带上原文链接，感谢
https://blog.csdn.net/Sugar_wolf/article/details/125634418

当前位置：网站首页>【736. Lisp 语法解析】

【736. Lisp 语法解析】

边栏推荐

猜你喜欢

随机推荐