anaconda是一个专为科学计算设计的python发行版,适用于linux、mac和windows系统。它提供了包管理和环境管理功能,方便解决多版本python共存、切换以及各种第三方包的安装问题。anaconda使用conda工具来管理package和environment,并且已经包含了python及相关的配套工具。conda是开源包(packages)和虚拟环境(environment)的管理系统。
包管理: 可以使用conda来安装、更新和卸载工具包,尤其关注数据科学相关的工具包。安装Anaconda时,预先集成了像Numpy、Scipy、pandas、Scikit-learn等常用于数据分析的包。此外,conda不仅管理Python包,还可以安装非Python包,例如新版Anaconda中可以安装R语言的集成开发环境Rstudio。
虚拟环境管理: 在conda中,可以创建多个虚拟环境,用于隔离不同项目所需的不同版本的工具包,以避免版本冲突。对于需要使用不同Python版本的用户,可以创建Python2和Python3两个环境,分别运行不同版本的Python代码。
Anaconda的优点? Anaconda的优点可以总结为八个字:省时省心、分析利器。
省时省心: Anaconda通过管理工具包、开发环境和Python版本,大大简化了工作流程。它不仅能方便地安装、更新和卸载工具包,还能自动安装相应的依赖包,并使用不同的虚拟环境隔离不同要求的项目。
分析利器: Anaconda官网宣传其为适用于企业级大数据分析的Python工具,包含了720多个数据科学相关的开源包,涵盖数据可视化、机器学习和深度学习等领域。不仅可用于数据分析,还可应用于大数据和人工智能领域。
在CentOS上安装Anaconda:
如果遇到conda命令找不到的错误提示,可能是环境路径设置的问题,需要添加conda环境变量:
查看conda版本:
添加channels:
或者直接修改conda的配置文件,通常在当前用户路径下,例如:
Conda的包管理: Conda的包管理功能类似于pip。例如,安装scipy:
conda会从远程搜索scipy的相关信息和依赖项目。对于Python 3.4,conda会同时安装numpy和mkl(运算加速库)。查看已安装的packages:
最新版的conda从site-packages文件夹中搜索已安装的包,不依赖于pip,因此可以显示通过各种方式安装的包。
conda的一些常用操作:
conda将conda、Python等都视为package,因此可以使用conda来管理conda和Python的版本,例如:
假设当前环境是Python 3.4,conda会将Python升级为3.4.x系列的当前最新版本。
如果创建新的Python环境,比如3.4,运行
之后,conda仅安装Python 3.4相关的必须项,如Python、pip等。如果希望该环境像默认环境那样,安装anaconda集合包,只需要:
结合创建环境的命令,可以合并为:
也可以根据需求只安装所需的package。
设置国内镜像: 如果需要安装很多packages,可能会发现conda下载速度很慢,因为Anaconda.org的服务器在国外。幸运的是,清华TUNA镜像源有Anaconda仓库的镜像,可以将其加入conda的配置:
执行上述命令后,会生成
(Linux/Mac)或文件,记录着对conda的配置。直接手动创建、编辑该文件也有相同的效果。