第一部分、数据结构快速入门,数据结构基础详解
数据结构基础,主要研究数据存储的方式。
本章作为数据结构的入门课程,主要让读者明白,数据结构到底是什么,常用的数据存储结构有哪些,数据结构和算法之间到底有怎样的关系等等。
深度剖析数据结构的本质,同时以通俗易懂的语言描述出来,致力于让读者快速入门数据结构。
七、数学不好,对学数据结构有影响吗?
很多初学者自认数学基础不好,怀疑这将是学习数据结构不可逾越的大山,对学习数据结构没有足够的信心。总的来说,数学基础不是学习数据结构的必备条件,但好的数据基础对学习数据结构大有助益。
这个问题,其实和“英语不好,可以学习编程吗?”同属一类。不可否认,英语基础好对于学习编程确实是很有帮助的,但它并不是学习编程不可跨越的鸿沟。事实上,只有从优秀程序员跃升为顶尖程序员时,英文基础(需要阅读一些英文资料)的桎梏才会凸显出来,但也并非无法克服。数学和数据结构之间的关系也是如此。
注意,英语基础薄弱并不等价于英语 0 基础,如果是这样,那在学习编程的过程中,确实需要适当地恶补一些英语;学习数据结构也是如此,如果数学基础很差(例如仅有小学功底),就需要在学习数据结构的过程中,有意识地恶补一下数学。这里所谓的恶补,不建议读者无目的地单纯学数学知识,而是在学习数据结构的过程中,遇到搞不懂的数学运算,再去刻意地翻阅相关资料。
举个简单的例子,前面已经详细的讲解了如何用“大 O 记法”来评判一个算法的时间复杂度,那么下面 C 语言代码的时间复杂度是多少呢?
i = 1;
while( i < n ){
i = i * 2;
}
对于此段代码来说,我们只需要求出 while 循环中代码(也就是第 3 行代码)执行的次数,即可轻松得到这段代码的时间复杂度。可以看到,循环条件为 i<n,而变量 i 的值每经历一次循环都会翻倍,因此假设有一个临界值 m,能恰好使 = n,此时循环将会终止,程序运行结束。
因此,求这段代码的时间复杂度,只需要求出 m 的值即可。这就需要我们具备对数运算的能力,由 = n 得 m = ,简化 m 的值并最终得出此段程序的时间复杂度为 O(logn)。此时,如果读者无法理解 m 值的由来,就需要恶补一下关于数学中对数运算的相关知识。
当然,对于绝大多数的数学运算,也可以借助计算器或者网络工具来计算得出。事实上,很多和编写代码无关的工作,我们完全不必亲力亲为,要善于运用网络来解决遇到的难题。
其次,一些读者学习数据结构的初衷,仅仅是想将数据结构应用到自己的项目中。这种情况下,数据基础则更显得无关紧要,因为在实际开发中,很多编程语言都提供有集成数据结构中各种存储结构的库或者模块,例如 C++ 中可以使用 STL 标准库,Python 中可以使用 collections 模块等等。这意味着,如果我们所用的编程语言提供有已封装好的数据结构,则只需简单了解数据结构中各个存储结构的特性,然后调用相关的库或者模块,即可实现最初的目的。
通过前面的学习我们知道,数据结构和算法完全是 2 个独立的学科,只是它们相辅相成(可阅读《第一部分、五:数据结构和算法的关系和区别》一节)。读者可能会问,学习数据结构肯定是要学习相关算法的,学习算法不需要有一定的数学基础吗?我认为,学习算法更多的是要求我们具备一定的问题分析能力和空间想象力(可以用画图弥补),很少有算法需要较高的数学功底。
总的来说,无论是学习数据结构还是学习算法,只要读者具备一定的编程能力,都可以学会。而至于数学基础的好坏,有更好,没有也无需沮丧,依然可以学习数据结构和算法。
八、学好数据结构,你已然超越了99%的程序员!
通过前面的学习我们知道,数据结构并不是一门具体的编程语言,它教会我们的是一种思维方式,即如何以更优的方式存储数据。或者正是由于这个原因,很多读者感觉数据结构虚无缥缈,无法触及,不如学习 Python、Java 等这些编程语言可以随学随用、掷地有声,久而久之觉得学习数据结构没用。
那么,数据结构真的无用吗?当然不是。作为计算机专业最重要的必修学科之一,计算机专业考研的必考知识,以及众多 IT 公司笔、面试的侧重考点,仅仅这些光环,就足以说明学习数据结构的重要性。
毋庸置疑,数据结构不仅有用,更应该是每个程序员必须掌握的基本功。
1、提升程序员的逻辑思维
首先,通过学习数据结构,可以大大拓宽我们的思维模式。掌握了数据结构与算法,我们看待问题的深度、解决问题的角度会大有不同,对于个人逻辑思维的提升,也是质的飞跃。
具体来讲,对于同一个问题,数据结构往往会教给我们不只一种解决思路。举个例子,假设我们需要从众多数据中查找出符合要求的元素,多数人就只能借助数组这种简单的存储结构来实现,而通过学习数据结构我们会知道,解决此类问题既可以通过构建二叉排序树、平衡二叉树、甚至红黑树、B+/B- 树来解决,还可以借助哈希表解决。
再举一个例子,几乎所有的编程语言中都提供有数组这种存储结构,但如果没学过数据结构,就绝不会想到,数组还能以链表的形式使用(也就是静态链表,后续章节会做详细讲解)。
事实上,数据结构也有众多编程语言无法比肩的优势。无论是 Java、Python、C++、PHP 还是其他编程语言,无时无刻不在更新迭代,而数据结构却永远不会过时,其包含的存储数据的思想,已经近乎将所有可能的情况都囊括其中,能解决 99% 的实际场景中有关数据存储的问题。
2、能力高低的分水岭
有很多读者(其中不乏在职的程序员)都会问一个问题,即为什么很多 IT 公司都特别注重对数据结构的考察?读者大可以这样认为:数据结构是众多 IT 公司评判面试人员能力高低的重要工具。
同任何一门编程语言相比,数据结构确实是晦涩难懂的。举个简单的例子,众多学习数据结构的读者中,可能很多人都能快速学会链表、哈希表、二叉树,还能熟练运用大部分的查找算法和排序算法,但能玩转路径规划、字符串匹配、动态规则等复杂问题的人,却凤毛麟角。
因此,要想学好数据结构,不仅要求学员具备良好的编程基础,还必须具有较强的逻辑分析能力和理解能力,甚至还需要具有一定的空间想象能力,可以这么说,能玩转数据结构的人,其综合实力往往都不差。很多大的互联网公司,更看重的往往不是你精通多少种编程语言,而是综合能力,更确切地说是解决问题的能力。
有些读者可能会问,类似 C++ 可以使用 STL 标准库,Python 代码可以使用 Collections 模块等,很多编程语言都可以使用相应的集成数据结构的框架或者模块,直接拿来用不就可以了吗?
事实上,很多在职程序员在开发过程中,都会套用现有的一些集成数据结构的模块或者框架。要知道,适当的使用是可取的,但不能完全依赖,否则知其然而不知其所以然,即便完成再多的项目,也无非是他人代码的搬运工,个人能力很快会进入瓶颈期,再无提升的空间。
3、程序性能好坏的评判标准
对于如何评判一个人编程能力的强弱,不同的人有不同的标准,或许是看中他编写代码的可读性,扩展性、是否健壮等等。
我认为,代码执行性能的好坏无疑能成为众多评判标准中的一个。而想编写出性能高的代码,前提是必须知道如何评判代码的性能,这就不得不使用数据结构中评判代码执行性能的时间复杂性和空间复杂度。
对于某些在职的程序员来说,如果觉得数据结构无用,更多可能是因为你接触的都是一些用户量很少、需要处理的数据量也很少的小项目,实际开发中更注重实现具体的功能,产品的性能要求并非那么苛刻。反之,如果你身处像 BAT 这样的大公司,所开发产品的用户量往往是千万级别甚至亿级别,需要处理的数据量也往往是 TB 甚至 PB 级别,这时产品的性能将是首要考虑的因素,而数据结构和算法的意义将会彻底凸显出来。
别忘了,数据结构也是很多大 IT 公司选拔人才的重要标准。