搭建一个高效的Python开发环境

“工欲善其事,必先利其器”,这里我们来搭建一套高效的 Python 开发环境,为后续的数据分析做准备。

关于高效作业,对于需要编写 Python 代码进行数据分析的工作而言,主要涉及两个方面。

1. 一款具备强大的自动完成和错误提示的开发工具

Python 丰富的函数库和组件库是这门语言强大的核心原因,但我们不可能去记忆所有的方法名和参数名,往往只能记住一些常用的或者某个方法开头的几个字母。这个时候一个好的开发工具就需要能聪明地“猜”出你想输入的代码,并给出候选列表方便你选择(类似于输入法的字词提示功能)。

另外,当你输入错误的时候,这个工具能够提示你具体是哪里错了,建议改成什么,从而大幅提升编写效率。在别人还在查到底是哪个单词拼错了导致代码跑不起来的时候,你已经写完一个完整的模块了。

2. 掌握快捷键

Python 数据分析需要边写边看结果,甚至每写两行代码就需要点击运行、新建文本段落、代码段落等操作。所以熟练地掌握快捷键,可以使绝大多数的操作都不需要鼠标,手不用离开键盘就能完成,起到事半功倍的效果。

整个配置过程相比传统的环境安装稍微多了几步,不过并不复杂,只需要跟着一步一步操作就可以。

搭建环境的版本说明如下:
Anaconda3.0

VS Code 1.51.1

实际并无太多版本限制,你安装最新版即可。

第一步、数据科学增强版的 Python 环境:Anaconda

Anaconda 是一个 Python 数据科学工具包,里面包含了 Python 做数据计算最常用的库和工具,属于必装软件。目前它已经非常成熟,并且整套 Anaconda 可以免费提供给个人使用。

1. 用浏览器访问 Anaconda 的个人版页面:https://www.anaconda.com/products/individual ,点击 Download,页面会自动跳转到具体的下载页面:

**2. 根据自己的设备类型 (Mac/Windows),选择合适的安装包版本。**无论 Windows 还是 Mac, 都选择 Graphical Installer,它代表图形化的安装器,之后更易于使用。

3. 下载之后双击安装包进行安装(如图所示),直接点击 Next。


4. 接下来就是使用协议界面,点击 I Agree,代表同意使用协议。


5. 之后连续 Next,可以看到选择安装位置的界面,如果没有特殊的需求,直接默认位置就好,继续点击 Next。

6. 最后一个配置界面是高级选项,不用更改,直接点击 Install,等待 2~3 分钟之后,即可完成安装。

安装完毕之后,可以从程序中找到 Anaconda Navigator,点击打开就可以看到整套 Anaconda3 的所有工具(如下图所示):

其中 Notebook 是数据分析应用范围最广泛的工具,但它却不是一款足够有效率的工具,因为它缺乏智能的代码输入联想、自动完成和错误提示。而有效率的分析师是不会容忍自己用“记事本”写代码的。

所以,接下来,我们可以在自己的电脑中配置一个智能、强大的 Notebook(此时安装好的 Anaconda3 页面先不关闭)。

第二步,飞一般的代码编辑器:VS Code

VS Code( Visual Studio Code),是微软开发的跨平台代码编辑器,靠着其强大的插件生态,目前已经成为全球最流行的代码编辑器。本次我们就通过 VS Code,来解决 Notebook 开发效率的问题。

首先按照以下的步骤安装和配置 VS Code。

**1. 下载:**用浏览器访问https://code.visualstudio.com/,网页会直接识别当前的操作系统,直接点击下载按钮,下载安装包。

**2. 安装:**下载完毕后,双击安装包进行安装,全部默认配置即可。

3. 安装中文语言包【可选,习惯英文的同学可以跳过】:启动 VS Code,进入插件 Tab(左侧边栏最后下方的图标),输入 【Chinese】,出现的第一个插件,点击 Install 安装。安装完成后,重启 VS Code 即可生效。

4. 安装 Python 插件:依旧是在插件面板,输入 【Python】,安装列表中的第一个插件。


至此,基础的 VS Code 环境已经配置完毕。

第三步,配置 VS Code 使用 Anaconda 的 Python 环境

打开 VS Code,选择【文件】-【新建文件】,会建立一个默认的文本文件,按 CTRL +s 保存,文件名为【hello.py】。

后缀名一定要是 .py,因为 VS Code 要根据文件的后缀名来匹配合适的工具链。

保存之后,如果 VS Code 识别到 Python 文件,我们上一步安装的 Python 插件就会开始工作,寻找本机的 Python 环境,结果会展示在下方的状态栏上。

Anaconda 的 Python 环境包含了丰富的科学计算的库,所以是做数据分析的首选。

确认环境之后,我们即可进入最后一步。

第四步,Jupyter in VS Code

我们进入 VS Code 的插件 Tab(左侧边栏最下方的图标),输入 Jupyter 安装由微软官方出品的 Jupyter 插件(前几个有 Microsoft 字眼的)。

安装完成之后,重启 VS Code(如果显示是禁用,那就是安装好了,直接操作后续即可)。按 【CTRL+P】 弹出命令面板,输入【>Jupyter】,此时会列出所有 Jupyter 插件支持的操作,选择 【Jupyter: Create New Blank Jupyter Notebook】,如下图所示。


选择之后,VS Code 内部就出现了一个类似 Notebook 的编辑界面,和传统的网页版 Notebook 不同,VS Code 中的 Notebook 具备强大的代码提示和自动完成的功能。接下来,我们来学习一下它的主要操作。

打开编辑界面,我们将 Notebook 可操作性的区域分为三个部分:主操作区、Cell 操作区、 边栏操作区。

主操作区:主要用来控制整个 Notebook 的一些行为.(大家可以把鼠标放在图标上看一下各个按钮对应的功能)。

边栏操作区:不同位置的“+”号代表在不同位置插入 Cell。

Cell 操作区:主要用来控制当前 Cell 的行为。

Cell 是 Notebook 中的核心概念,直译过来是“单元格”,但 Notebook 中的 Cell 却不能用单元格简单概括,所以本文统一用 Cell 描述,一个 Notebook 由多个 Cell 组成。
Cell 一共有两种类型:

代码 Cell,主要用来编写 Python 代码,每个代码 Cell 都可以单独执行,并且执行结果会展示在 Cell 的下方。

文本 Cell,顾名思义,用来编写文本, 对于数据分析工作而言,除了代码本身,分析的思路、推导的逻辑同样非常重要,文本 Cell 就是用来承载这些内容。

这也是 Notebook 区别于 IPython 最大的地方,可以实现代码和文本的混排,来最大化的呈现数据分析的产出。

Notebook 的基本操作

接下来,我们通过一个具体的目的,学习一下 Notebook 的基本操作。这些操作在后续的博文中会经常用到,我们先通过几个简单的小案例初步熟悉一下。

1、创建一个 Notebook,保存为 my_practice.ipynb。

2、添加一个 Cell,通过代码打印“this is my first Notebook”, 并运行。 在之后的案例中,我们每介绍一个小阶段,都会通过新建一个 Cell 来编写代码测试我们实验的内容。

3、添加一个 Cell,并转换成文本 Cell,输入文字“我的数据分析启程了!”。

4、添加一个 Cell,通过代码打印 1+1 的结果。

下面我们开始完成上面的案例:

第一步,按【CTRL + P】(Mac 对应【CMD + P】), 调出 VS Code 的命令面板,输入【> Jupyter】可以看到 Notebook 插件支持的命令,其中比较常用的几个如下。

  1. Create New Black Jupyter Notebook: 创建新的空白 Notebook 工作区。
  2. Export to PDF:将当前的 Notebook 导出为 PDF,在后续写数据分析报告的时候会用到。
  3. Import Jupyter Notebook:导入已有的 Notebook。用来导入已有的 Notebook 文件。


首先选择第一个,创建一个新的 Notebook,创建之后按 【CTRL + S】 保存,文件名输入:first.ipynb。

第二步,新建 Cell,我们点击边栏操作区的 + 号即可新建 Cell, 然后我们输入以下代码:


第三步,我们类似第二步首先新建一个 Cell,并点击 Cell 操作区中的 M 图标,切换为文本模式,并输入“我的数据分析启程了!”。输入完毕后鼠标点击 Cell 之外的任意区域即可退出编辑模式,进入预览模式(双击 Cell 可重新进入编辑模式)。这样,我们的第三步就完成了。 如图所示。


第四步,就很简单了,我们直接新建一个 Cell, 并输入以下代码:

print(1+1)

运行 Cell,可以看到打印了“2”,至此,我们的任务已经全部完成。整个过程如图所示。

至此,你已经在自己电脑上配置出一套面向数据分析的 Python 开发环境,也知道如何新建 Notebook,以及在 Notebook 中添加代码 Cell 来输入代码、文本 Cell 来输入文字。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/274028.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

如何快速获取抖音新用户/用户信息

一、快速获取抖音用户信息意味着什么? 抖音是一款热门的短视频社交平台,拥有海量用户和高度活跃的商业生态。用户逐渐增多,庞大的用户也意味着隐藏着庞大的市场和商机,用户的偏好、关注点等信息都时刻影响着商业的效益&#xff0…

推特(Twitter)蓝V

点击个人订阅 这里需要一张visa卡才可以订阅,点击获取 订阅成功

2024 年混合云:趋势和预测

混合云环境对于 DevOps 团队变得越来越重要,主要是因为它们能够弥合公共云资源的快速部署与私有云基础设施的安全和控制之间的差距。这种环境的混合为 DevOps 团队提供了灵活性和可扩展性,这对于大型企业中的持续集成和持续部署 (CI/CD) 至关重要。 在混…

GitHub的2FA验证问题解决工具

文章目录 前言认识2FA开源工具使用:AuthenticatorPro获取AuthenticatorPro的安卓APK如何使用 参考文章 前言 打开GitHub跳出来这个提示,需要进行验证: 如何解决呢?方案有很多,我们可以使用开源的一个工具:…

查看ios app运行日志

摘要 本文介绍了一款名为克魔助手的iOS应用日志查看工具,该工具可以方便地查看iPhone设备上应用和系统运行时的实时日志和奔溃日志。同时还提供了奔溃日志分析查看模块,可以对苹果奔溃日志进行符号化、格式化和分析,极大地简化了开发者的调试…

基于机器视觉工业相机的Raw图像和Bitmap图像的保存和转换(C#代码,UI界面版)

基于机器视觉工业相机的Raw图像和Bitmap图像的保存和转换(C#代码,UI界面版) 工业相机图像格式工业相机实现Raw图像和Bitmap图像的保存和转换的技术背景在相机SDK中获取图像转换图像的代码分析工业相机回调函数里保存Bitmap图像数据工业相机图…

Sectigo的OV多域名通配符证书与通配符证书

Sectigo的OV多域名通配符SSL证书和通配符SSL证书都可以同时保护多个域名记录,但是Sectigo的OV多域名通配符SSL证书并不是多域名SSL证书加通配符SSL证书,而是多个泛域名,并不包括泛域名的主域名。今天就随SSL盾小编了解Sectigo旗下的OV多域名通…

【AI】人工智能爆发推进器之卷积神经网络

目录 一、什么是卷积神经网络 1. 卷积层(Convolutional Layer) 2. 激活函数(Activation Function) 3. 池化层(Pooling Layer) 4. 全连接层(Fully Connected Layer) 5. 训练过程…

部署YUM软件仓库

借助于YUM软件仓库.可以完成安装、卸载、自动升级rpm软件包等任务,能够自动查找并解 决rpm包之间的依赖关系,而无须管理员逐个.手工地去安装每个rpm包,使管理员在维护大量Linux 服务器时更加轻松自如。.特别是在拥有大量Linux主机的本地网络中…

代码随想录27期|Python|Day27|回溯算法|39.组合总和|40.组合总和II|131.分割回文串

39. 组合总和 在Day24组合问题的模版上加上了一个“可以重复选用当前值”的选项,递归中调用backtracking的idx由i 1改为i: self.backtracking(i, path, res, candidates, target) # 起始位置变成i,可以重复使用当前的值 class Solution(object):def…

最新国内使用GPT4教程,GPT语音对话使用,Midjourney绘画,ChatFile文档对话总结+DALL-E3文生图

一、前言 ChatGPT3.5、GPT4.0、GPT语音对话、Midjourney绘画,文档对话总结DALL-E3文生图,相信对大家应该不感到陌生吧?简单来说,GPT-4技术比之前的GPT-3.5相对来说更加智能,会根据用户的要求生成多种内容甚至也可以和…

ESP8266 ESP-01/01s 工作模式与固件下载烧录接线

注意点: ESP8266 ESP-01与 ESP8266 ESP-01s接线类似 。本文使用的是ESP8266 ESP-01 WIFI模块,详细信息见如下图片。本文固件下载的是ESP8266 的MQTT固件,下载其它固件流程一致。本文使用的是杜邦线连接面包板来进行使用,与使用开发…

Bert模型from_pretrained报网络错误解决办法

问题描述: 服务器或者本地运行以下代码时报网络连接错误: from transformers import AutoTokenizermodel_checkpoint "distilbert-base-uncased" tokenizer AutoTokenizer.from_pretrained(model_checkpoint, use_fastTrue, cache_dir./cac…

【大数据HA】HAProxy实现thrift协议HMS服务的高可用-附Chatgpt协助截图

背景 之前安装了HMS(Hive metastore service),独立于hive运行,安装部署过程见我下面列出的另一篇文章,需要为它建立HA高可用功能。防止在访问时出现单点故障问题。 【大数据】Docker部署HMS(Hive Metastore Service)并使用Trino访问Minio-C…

fragstats:景观指数趋势分析

作者:CSDN _养乐多_ 本文将介绍景观指数时间序列的趋势分析,包括趋势类型、斜率、截距等。以及景观指数突变分析所用的软件和 python 代码。 结果如下图所示, 图1 趋势分类图 图2 MK趋势分析 文章目录 一、景观指数计算二、景观指数时间序…

网络技术基础与计算思维实验教程_4.4_RIPv2配置实验

构建 放置三个型号为2811的路由器 给router0安装两个快速以太网接口 " 同样的方法给router2安装 为1安装有一个以太网接口的模块 这样router1就有三个快速以太网接口和两个无线路由器接口了 构建两个和router0相连的以太网 构建和router2相连的以太网 构建和r…

【JavaScript】闭包机制

✨ 专栏介绍 在现代Web开发中,JavaScript已经成为了不可或缺的一部分。它不仅可以为网页增加交互性和动态性,还可以在后端开发中使用Node.js构建高效的服务器端应用程序。作为一种灵活且易学的脚本语言,JavaScript具有广泛的应用场景&#x…

C#高级 01.Net多线程

一.基本概念 1.什么是线程? 线程是操作系统中能独立运行的最小单位,也是程序中能并发执行的一段指令序列线程是进程的一部分,一个进程可以包含多个线程,这些线程共享进程资源进程有线程入口,也可以创建更多的线程 2.…

不浪费时间,昂首资本1分钟如何快速学习MT4价差

不要浪费时间在手工计算上,昂首资本解释一下如何快速学习MT4价差,。 想要在MT4中输入交易时,需要在交易窗口中设置未来交易的参数。在同一个窗口中,可以看到卖价和买价。如果在上面的例子中比较这两个价格,就会发现两…

个人网站的搭建部署及自定义域名

个人网站的搭建部署及自定义域名 写在前面个人网站的搭建个人网站的部署自定义域名更多模板 写在前面 个人网站模板获取方式:个人网站模板视频教程:视频教程 个人网站的搭建 使用PyCharm打开提前准备好的个人网站模板: 双击打开index.htm…