8. 字符串转换整数 (atoi)

发布时间 2023-10-21 20:14:46作者: DawnTraveler

1.题目介绍

2.题解

2.1 初版

思路

1.首先要去除前导的多余空格,无论是用循环遍历去除,还是用这里的s.find_first_not_of(' ');均可;如果保存了索引不需要多余处理,如果没有保存直接使用s.substr(firstNonSpace);进行截断。

2.考虑到可能为空串或者全为空格的情况,如果截断之后字符串为空,return 0即可

3.接下来处理符号‘+’,‘-’,设置一个标志位flag进行标记,同时不要忘记将符号从其中去除,如果去除空格后的字符不为数字,也是return 0;
这里有朋友可能会考虑到"0032" -> 32的情况,要不要对于第一个字符为0的情况进行单独讨论呢?其实并不需要,参考下面的计算表达式result = result * 10 + digit; 0*10 + 0 = 0,开头读‘0’并不会有任何影响

4.开始遍历剩余字符串,直到读出的数不为数字为止。这里要注意的是讨论溢出的情况

代码

//
// Created by trmbh on 2023-10-21.
//
#include <iostream>
#include <string>
#include <algorithm>

class Solution {
public:
    int myAtoi(std::string s) {
        bool flag = true;
        s = removeLeadingSpaces(s);

        if (s.empty()) return 0;

        char c = s[0];
        switch (c) {
            case '+':
                flag = true;
                s = s.substr(1);
                break;
            case '-':
                flag = false;
                s = s.substr(1);
                break;
            default:
                if (!isdigit(c)) return 0;
        }

        return processNumberString(s, flag);
    }

private:
    std::string removeLeadingSpaces(const std::string &s) {
        size_t firstNonSpace = s.find_first_not_of(' ');
        if (firstNonSpace == std::string::npos) return "";
        return s.substr(firstNonSpace);
    }

    int processNumberString(const std::string &s, bool positive) {
        int result = 0;
        for (int i = 0; i < s.size(); i++) {
            if (!isdigit(s[i])) return result; // 不是数字字符,返回已有结果

            int digit = s[i] - '0';

            if (positive) {
                if (result > INT_MAX / 10 || (result == INT_MAX / 10 && digit > 7)) {
                    return INT_MAX;
                }
                result = result * 10 + digit;
            } else {
                if (result < INT_MIN / 10 || (result == INT_MIN / 10 && digit > 8)) {
                    return INT_MIN;
                }
                result = result * 10 - digit;
            }
        }
        return result;
    }
};

int main() {
    std::string str = "-2147483648";
    Solution solution;
    std::cout << solution.myAtoi(str);
    return 0;
}

2.2 优化

思路

前面是使用截断的方法,这里就使用索引的方式,并进行一些优化。
1.while循环去除空格
2.处理符号‘+’,‘-’,并添加标记sign
3.while循环处理数字
4.这里处理溢出为何只写了一个if?不分别处理上溢出和下溢出?
其实我们仔细想想,int整型范围:-2147483648~2147483647
(为何负数比正数多一个,请参考 https://www.cnblogs.com/trmbh12/p/17773283.html)
这里的判断:(result == INT_MAX / 10 && digit > 7)

  • 对于-2147483647 和 2147483647,都在int整型范围内,根据result = result * 10 + digit;计算得到2147483647,之后根据标志位判断是否取反,并不会溢出。
  • 对于<=-2147483648的负数 和 >=2147483648的正数,return (sign == 1) ? INT_MAX : INT_MIN; 负数这里相当于一个刚好在边界,其他的均不在int整型范围内,均判断为INT_MIN:-2147483648;而正数均超出范围,均判断为INT_MAX,也成立。

代码

class Solution {
public:
    int myAtoi(std::string s) {
        int result = 0;
        int sign = 1; // 默认正数
        int i = 0;
        // 移除前置空格
        while (i < s.length() && s[i] == ' ') {
            i++;
        }
        // 处理符号
        if (i < s.length() && (s[i] == '+' || s[i] == '-')) {
            sign = (s[i++] == '-') ? -1 : 1;
        }
        // 处理数字字符
        while (i < s.length() && isdigit(s[i])) {
            int digit = s[i] - '0';
            // 检查溢出
            if (result > INT_MAX / 10 || (result == INT_MAX / 10 && digit > 7)) {
                return (sign == 1) ? INT_MAX : INT_MIN;
            }
            result = result * 10 + digit;
            i++;
        }
        return result * sign;
    }
};

2.3 自动机

思路及算法

字符串处理的题目往往涉及复杂的流程以及条件情况,如果直接上手写程序,一不小心就会写出极其臃肿的代码。

因此,为了有条理地分析每个输入字符的处理方法,我们可以使用自动机这个概念:

我们的程序在每个时刻有一个状态 s,每次从序列中输入一个字符 c,并根据字符 c 转移到下一个状态 s'。这样,我们只需要建立一个覆盖所有情况的从 s 与 c 映射到 s' 的表格即可解决题目中的问题。

\[\begin{array}{|c|c|c|c|c|} \hline & \text{' '} & +/- & \text { number } & \text { other } \\ \hline \text { start } & \text { start } & \text { signed } & \text { in_number } & \text { end } \\ \hline \text { signed } & \text { end } & \text { end } & \text { in_number } & \text { end } \\ \hline \text { in_number } & \text { end } & \text { end } & \text { in_number } & \text { end } \\ \hline \text { end } & \text { end } & \text { end } & \text { end } & \text { end } \\ \hline \end{array}\]

代码

class Automaton {
    std::string state = "start";
    std::unordered_map<std::string, std::vector<std::string>> table = {
            {"start", {"start", "signed", "in_number", "end"}},
            {"signed", {"end", "end", "in_number", "end"}},
            {"in_number", {"end", "end", "in_number", "end"}},
            {"end", {"end", "end", "end", "end"}}
    };

    int get_col(char c) {
        if (isspace(c)) return 0; //前导‘ ’跳过,后置‘ ’跳至end
        if (c == '+' or c == '-') return 1;
        if (isdigit(c)) return 2;
        return 3;
    }
public:
    int sign = 1;
    long long ans = 0;

    void get(char c) {
        state = table[state][get_col(c)];
        if (state == "in_number") {
            ans = ans * 10 + c - '0';
            ans = sign == 1 ? std::min(ans, (long long)INT_MAX) : std::min(ans, -(long long)INT_MIN);
        }
        else if (state == "signed")
            sign = c == '+' ? 1 : -1; //判断是'+'或者'-'
        else if (state == "end")
            return; // 在状态为 "end" 时,直接结束
    }
};

作者:力扣官方题解
链接:https://leetcode.cn/problems/string-to-integer-atoi/solutions/183164/zi-fu-chuan-zhuan-huan-zheng-shu-atoi-by-leetcode-/
来源:力扣(LeetCode)
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。