字符串转化整数(atoi)
1、题目描述
LeetCode8. 请你来实现一个myAtoi(String s)函数,使其能将字符串转换成一个32位有符号整数(类似C/C++ 中的atoi函数)。
函数myAtoi(String s) 的算法如下:
- 读入字符串并丢弃无用的前导空格。
- 检查下一个字符(假设还未到字符末尾)为正还是负号,读取该字符(如果有)。确定最终结果是负数还是正数。如果两者都不存在,则假定结果为正。
- 读入下一个字符,直到到达下一个非数字字符或到达输入的结尾。字符串的其余部分将被忽略。
- 将前面步骤读入的这些数字转换为整数(即,“123” -> 123,“0032” -> 32)。如果没有读入数字,则整数为0。必要时更改符号(从步骤2开始)。
- 如果整数超过32位有符号整数范围[-2^31, 2^31 - 1],则需要阶段这个整数,使其保持在这个范围内。具体来说,小于 -2^31 的整数应该被固定为-2^31,大于 2^31 - 1 的整数应该固定为 2^31 - 1。
- 返回整数作为最终结果
注意:
本题中的空白字符只包括空格字符
' '
除前导空格或数字后的其余字符串外,请勿忽略任何字符
2、分析与解答
我们可以从题目给的五个示例中提取出几个要点:
- 根据示例1,需要去掉前导空格
- 根据示例2,需要判断第一个字符为 + 和 - 的情况,因此,可以设计一个变量sign,初始化的时候为1,如果遇到 - ,将sign设为-1。
- 判断是否是数字,可以使用字符的ASCII码数值进行比较,即’0’ <= c <= ‘9’,如果0在最前面,则应该将其去掉。
- 根据示例3和示例4,在遇到第一个不算数字的字符的情况下,转换停止,退出循环。
- 根据示例5,如果转换以后的数字超过了int类型的范围,需要截取。这里不能将结果res变量设计为long类型,注意:由于输入的字符串转换以后也有可能超过long类型,因此需要在循环内部就判断是否越界,只要越界就退出循环,这样也可以减少不必要的计算。
- 由于涉及下标访问,因此全程需要考虑数组下标是否越界的情况。
根据这些,我们可以给出如下java代码:
public static int myAtoi(String str) {
int len = str.length();
char[] charArray = str.toCharArray();
//去除前导空格
int index = 0;
while (index < len && charArray[index] == ' ') {
index++;
}
//如果已经遍历完成(针对极端用例" ")
if (index == len) {
return 0;
}
//如果出现符号字符,仅第一个有效,并记录正负
int sign = 1;
char firstChar = charArray[index];
if (firstChar == '+') {
index++;
} else if (firstChar == '-') {
index++;
sign = -1;
}
//将后续出现的数字字符进行转换
//不能使用long类型,这是题目说的
int res = 0;
while (index < len) {
char currChar = charArray[index];
// 先判断不合法的情况
if (currChar > '9' || currChar < '0') {
break;
}
//题目中说只能存储32位大小的有符号整数,下面两个if分别处理整数和负数的情况。
//提前判断乘以10以后是否越界,但res*10可能会越界,所以这里使用Integer.MAX_VALUE/10,这样一定不会越界。
//这是解决溢出问题的经典处理方式。
if (res > Integer.MAX_VALUE / 10 || (res == Integer.MAX_VALUE / 10 && (currChar - '0') > Integer.MAX_VALUE % 10)) {
return Integer.MAX_VALUE;
}
if (res < Integer.MIN_VALUE / 10 || (res == Integer.MIN_VALUE / 10 && (currChar - '0') > -(Integer.MIN_VALUE % 10))) {
return Integer.MIN_VALUE;
}
//合法的情况下,才考虑转换,每一步都把符号位乘进去
//如果不带着符号位乘,当数是负数的时候,每一次识别到的currChar是正数,这样转换的时候不会得到正确值
res = res * 10 + sign * (currChar - '0');
index++;
}
return res;
}