Python存在Python 2(现在一般指Python 2.7)和Python 3(现在一般指Python 3.5及以上)两个不同的版本号。Python官方宣布于2020年停止Python 2的更新和维护,全面进入Python 3时代。考虑到学习和应用的普适性,本书的介绍以Python 3版本为基础。

目前流行的Python集成开发环境(IDE)很多,如PyCharm、Sublime Text、Eclipse+PyDev和Anaconda中的Spyder。不同的软件、系统的安装和配置方式各不相同,本书使用Anaconda平台的Jupyter Notebook对Python进行介绍。Anaconda是非常强大的跨系统开源计算平台,支持个人PC使用的Windows、Linux和macOS系统,提供的近1000个开源软件包,基本上可以满足个人或团队进行数据处理的需求。

为了满足不同读者的需求,本书介绍两种Python线上平台,以及本地机器环境下相关软件的安装和配置,读者可任意选择使用。

网络上现在有很多在线的Python解释器,读者可以在计算机有网络服务的情况下通过浏览器运行代码。因为软件包的导入和计算都在服务器端,所以读者不需要较高配置的计算机就能实现Python的学习和数据分析。

本书推荐两个免费的Jupyter Notebook网站,读者可以结合自己计算机的配置和网络情况进行选择。

(1)Jupyter官方提供的Try Jupyter网站(https://jupyter.org/try),如图1-1所示,该网站包含学习在Jupyter中使用Python和文本书写的例子和练习,读者可以在Try Python with Jupyter的主页(在Try Jupyter网站选择使用Python)运行、调试代码,并下载Jupyter笔记本到本地存储。

(2)微软公司提供的Jupyter数据探索学习平台Azure(https://notebooks.azure.com/),如图1-2所示,支持在线运行多种编程语言进行数学科学探索,其中比较常用的是Python和R语言。读者可以通过微软账户创建仓库,新建Jupyter Notebook并书写代码和探索数据,完成后可以保存,也可以与他人分享(使用过GitHub等开源仓库的读者会发现这个平台的操作和它们极为相似)。

Picture

图1-1 Jupyter官方提供的Python在线Notebook页面

Picture

图1-2 微软Jupyter数据科学学习平台

推荐读者使用Azure平台,因为其在创建、使用、保存与分享方面更具优势,不过读者首先需要创建一个微软账号。

随着时间的推移,我们相信会有越来越多的线上Jupyter Notebook平台,感兴趣的读者不妨搜索、汇总,选择最适合自己学习和使用的平台。

如果想要在本地部署学习环境,那么可以选择安装两款软件。第一款软件是上文已经提到的Anaconda,为必需软件;第二款软件为nteract(https://nteract.io/),见图1-3,为可选软件。与Anaconda默认提供的Jupyter Notebook不同,nteract像我们常用的文字编辑器一样,界面非常简洁,可以非常方便地编辑Jupyter Notebook文件(文件扩展名为.ipynb)。推荐使用nteract,本书后续的代码和文档展示都会使用到它。虽然nteract目前只有alpha版本(测试版),功能还在不断完善中,但是这不会影响我们使用它学习Python。其实,由于Jupyter Notebook与nteract运行Python都基于IPython内核ipykernel,除了界面、显示效果和一些细微之处,两者在使用上并没有太多的不同,因此不用纠结于是选择使用默认Jupyter Notebook还是nteract进行Python学习的问题。

Picture

图1-3 nteract官网页面

1.Anaconda的下载与安装

到Anaconda官网中下载对应操作系统的Python 3版本Anaconda。

在搜索引擎中输入关键字“Anaconda”,也可以轻松地找到Anaconda官网地址,如图1-4所示。

Picture

图1-4 查找Anaconda

Anaconda下载页面会根据你使用的操作系统(Windows、Linux、macOS)自动推荐相应的安装包,如图1-5所示。根据自己的操作系统位数(目前市面上的计算机以64位为主),单击左侧Download下方的下载链接进行下载。

Picture

图1-5 Anaconda官网页面

如果读者在阅读本书时,Anaconda的Python版本与图1-5所示的Python 3.7有所不同,可以选择更新的版本或者在网络上寻找Python 3.7版本的Anaconda进行下载。由于Python的向下兼容性,即使使用更新的版本,本书所有示例代码不出意外也都能成功运行。

2.Anaconda在Windows与macOS系统上的安装

Windows与macOS系统中的Anaconda安装都是图形化的,与普通办公软件的安装类似,非常简单。

下面以Windows系统下的安装为例进行详细说明。

首先双击下载的Anaconda安装器,单击“Next”,如图1-6所示。

Picture

图1-6 单击“Next”

程序会弹出许可协议界面,单击“I Agree”,如图1-7所示。

Picture

图1-7 单击“I Agree”

接下来选择安装类型:是为计算机的每一位用户(第二项)还是仅仅当前用户(第一项)安装Anaconda。如果不确定,则选择默认选项,单击“Next”即可,如图1-8所示。

Picture

图1-8 选择合适的安装类型

接下来需要为Anaconda选择合适的安装位置。推荐将Anaconda安装在用户目录的Anaconda3目录(如果不存在,可以新建)下,如图1-9所示。如果选择其他目录,请尽量避免安装路径含中文名称。

Picture

图1-9 选择合适的安装位置

下一步是设定高级安装选项:环境变量。虽然Anaconda默认不推荐将Anaconda添加到环境变量,但这里推荐勾选该选项,如图1-10所示。勾选该选项的好处是我们可以通过终端(Windows中的cmd)访问所有的Anaconda组件,包括Python、Spyder、Jupyter Notebook等。

Picture

图1-10 选择合适的安装位置

单击“Install”进行安装,如图1-11所示。由于安装的内容很多,所以整个安装过程耗时较长,一般需要半小时左右,请耐心等待。

Picture

图1-11 安装进度

安装进度条完成后,单击“Next”,如图1-12所示。

Picture

图1-12 安装进度条完成

Anaconda推荐安装VS Code代码编辑器,该软件可装可不装,请自行选择。如果不安装,单击“Skip”跳过即可,如图1-13所示。

Picture

图1-13 跳过安装Visual Studio Code

最后,单击“Finish”完成安装过程。

3.Anaconda的Linux版本的安装

在Linux系统上安装Anaconda是使用命令行方式进行的(也适用于macOS系统),下载完Anaconda的Linux版本后,打开文件所在目录,并在该目录下打开终端(也可以从其他目录使用cd命令切换)。

然后,输入命令:

# 除了使用浏览器,也可以通过终端运行以下命令下载Anaconda
# wget -c https://repo.anaconda.com/archive/Anaconda3-2018.12-Linux-x86_64.sh

# 添加执行权限
chmod u+x Anaconda3-2018.12-Linux-x86_64.sh
# 执行安装
./Anaconda3-2018.12-Linux-x86_64.sh

# 也可以直接使用Bash进行安装
bash Anaconda3-2018.12-Linux-x86_64.sh

接着按照提示按回车键或单击“Yes”。注意:最后安装程序提示是否将Anaconda添加到环境变量时,一定要键入“Yes”同意。

最后,测试Anaconda是否已经安装成功。新建一个终端,键入下面命令后将会打开Jupyter Notebook(在Windows操作系统中,使用<Windows+R>组合键,然后输入“cmd”)。

jupyter notebook

默认情况下,浏览器会自动打开,跳转到主页面,如图1-14所示。

Picture

图1-14 本地浏览器Jupyter Notebook主页

如果读者想进一步了解Anaconda及其安装、Jupyter Notebook的相关知识,不妨多查阅网络上的资料,目前网上相关的介绍和问题解答非常丰富。

4.nteract下载与安装

到nteract官网下载不同操作系统对应的软件版本,在Windows、macOS与Linux系统中都可以直接安装。

安装后直接单击软件图标打开,软件主界面如图1-15所示。

Picture

图1-15 nteract界面

单击菜单栏中的“Runtime”,如果出现“Python”字样,那么说明nteract可以正常使用,同时左下方也会出现“python3”标记。如果没有出现上述内容,那么需要检查是否已经成功安装Anaconda,并将其添加到环境变量。

到此为止,我们已经成功搭建了Python的学习环境,迈出了学习Python数据分析的第一步。从下一章开始,我们将正式进入Python基本语法与操作的学习。