Conda是一个开源的包管理系统和环境管理系统,主要用于简化软件包安装和管理,同时还能创建和管理独立的环境。这些功能使得Conda在数据科学、机器学习和科学计算领域非常受欢迎。
Conda的安装
安装Conda有两种主要方式:通过Anaconda或Miniconda。
选择取决于你的需求:
- Anaconda:适合需要一套完整的数据科学工具的用户。它包含了Python和大量的科学计算库(如NumPy、Pandas、SciPy等)以及工具(如Jupyter Notebook)。
- Miniconda:适合希望从头开始安装所需包的用户。它仅包含Conda和Python,是一个较小的安装包。
安装完成后,你可以打开终端(或Anaconda Prompt)并输入以下命令以验证Conda是否正确安装:conda –version
Conda常用命令
基本命令
conda info # 查看Conda信息 conda –version #查看 conda 版本 conda update conda # 更新Conda(慎用) conda clean –all # 清理不再需要的包: conda –help # 查看帮助 conda <指令> --help #查看某一个指令的详细帮助 conda config --show #查看 conda 的环境配置 conda clean -p # 清理没有用,没有安装的包 conda clean -t # 清理 tarball conda clean --all # 清理所有包和 conda 的缓存文件
环境管理
创建Conda环境
使用conda可以在电脑上创建很多套相互隔离的Python环境,命令如下:
# 语法 conda create --name <env_name> python=<version> [package_name1] [package_name2] [...] # 样例 创建一个名为PaddleOCR的环境,python版本为3.7 conda create --name PaddleOCR python=3.7
切换Conda环境
前面说到Conda可以创建多套相互隔离的Python环境,使用conda activate env_name可以切换不同的环境。
# 语法 conda activate env_name # 样例 切换到PaddleOCR环境 conda activate PaddleOCR
如果要退出此环境,回到基础环境 可以使用如下命令
# 退出当前环境 conda deactivate
查看电脑上已安装的Conda环境
当电脑上安装了很多台Conda环境的时候,可以使用conda env list命令查看所有已创建的Conda环境。
# 查看当前电脑上所有的conda环境 conda env list
删除某个Conda环境
如果某个环境不需要了,可以使用conda remove命令移除环境,语法如下:
# 语法 conda remove --name <env_name> --all # 样例 conda remove --name PaddleOCR –all
复制环境
conda create --name myclone --clone myenv
包管理
安装包
在激活的环境中安装包,例如安装NumPy:
conda install numpy
可以使用以下命令安装特定版本的包:
conda install numpy=1.18
更新包
更新某个包到最新版本:
conda update numpy conda update --all #更新所有包
执行命令后,conda将会对版本进行比较并列出可以升级的版本。同时,也会告知用户其他相关包也会升级到相应版本。当较新的版本可以用于升级时,终端会显示 Proceed ([y]/n)? ,此时输入 y 即可进行升级。
卸载包
如果不再需要某个包,可以将其卸载:
conda remove numpy
列出环境中的所有包
查看当前环境中已安装的所有包:
conda list
查看当前虚拟环境中已安装的某个包的信息
conda list pip
搜索包
搜索可用的包及其版本信息:
conda search package-name
使用通道
Conda通道(Channel)是Conda用来查找和下载软件包的源。通道就像是软件仓库,用户可以从这些通道中获取需要的软件包。理解和有效管理Conda通道,可以帮助用户更好地控制软件包的来源、版本以及稳定性。
主要通道
- 默认通道:这是Conda自带的官方通道,由Anaconda维护,包含了常用的数据科学和机器学习包。默认通道提供的包经过测试和优化,通常是稳定且值得信赖的。
- Conda-Forge:Conda-Forge是一个社区驱动的通道,拥有数量庞大的软件包和活跃的维护者社区。通常情况下,Conda-Forge提供更多的最新软件包版本,对于一些在默认通道中没有的包来说尤为重要。由于是社区维护,更新速度快,适合需要最新特性和支持的用户。
- Bioconda:专为生物信息学和生物数据分析设计的通道。包含很多用于生物数据处理和分析的工具。
查看已配置的通道
你可以使用以下命令查看当前配置的通道列表:
conda config --show channels
添加新的通道
如果需要从其他通道安装包,可以将其添加到Conda配置中。例如,添加Conda-Forge:
conda config --add channels conda-forge
设置通道顺序
通道是按顺序搜索的,优先使用在前面的通道。可以通过以下命令调整顺序:
conda config --set channel_priority strict
使用strict优先级时,Conda会严格按照通道顺序来选择包。
删除通道
如果不需要某个通道,可以将其移除:
conda config --remove channels channel-name
临时使用特定通道
你可以在安装包时临时指定通道,而不改变全局配置。例如:
conda install package-name -c conda-forge
这样做会从Conda-Forge通道安装指定的包。
通道优先级
Conda允许设置通道优先级,以决定从哪个通道下载软件包。默认情况下,Conda会根据通道列表的顺序依次查找包。你可以通过以下命令启用或禁用通道优先级:
conda config --set channel_priority true # 启用优先级 conda config --set channel_priority false # 禁用优先级
启用优先级后,Conda会严格根据通道顺序来选择包,确保从首选通道安装。
创建自定义通道
如果你需要在团队中共享包,或者需要托管私有包,可以创建自己的Conda通道。自定义通道可以通过简单的HTTP服务器(如NGINX或Apache)托管,或者使用Anaconda的企业解决方案。
设置镜像
为了提高Conda包的下载速度,特别是在网络连接到默认的Conda服务器速度较慢的情况下,设置国内镜像(或其他更接近你的地理位置的镜像)是一个常见且有效的方法。
以下是如何设置Conda镜像的步骤:
方法一:通过命令行配置
你可以使用conda config命令来添加镜像。例如,使用清华大学的Anaconda镜像。
- 打开命令提示符或终端。
- 添加镜像URL:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2 conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/menpo conda config --set show_channel_urls yes
默认情况下,conda config添加的通道会排在列表的头部,但你可以通过以下命令来确认顺序:
conda config --show channels
方法二:通过修改配置文件
你也可以直接修改Conda的配置文件来设置镜像:
- 找到并编辑Conda的配置文件:~/.condarc(Linux和macOS)或 C:\Users\<用户名>\.condarc(Windows)。TUNA 提供了 Anaconda 仓库与第三方源(conda-forge、msys2、pytorch等,各系统都可以通过修改用户目录下的 .condarc 文件来使用 TUNA 镜像源。Windows 用户无法直接创建名为 .condarc 的文件,可先执行 conda config –set show_channel_urls yes 生成该文件之后再修改。
- 添加或修改如下内容:
channels: - defaults show_channel_urls: true default_channels: - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2 custom_channels: conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud pytorch-lts: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud deepmodeling: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/
运行 conda clean -i
清除索引缓存,保证用的是镜像站提供的索引。
验证和测试
在设置完镜像后,你可以通过安装软件包来测试镜像是否工作正常。例如:
conda install numpy
查看输出的信息,确保包是从你设置的镜像URL下载的。
环境导出与导入
导出环境
将当前环境导出为一个YAML文件,方便共享:
conda env export > environment.yml
从文件创建环境
使用YAML文件创建一个新环境:
conda env create -f environment.yml
Mamba使用
Mamba是一个用于管理Conda环境和包的开源工具,旨在解决Conda在处理大型环境时的速度和性能问题。它与Conda兼容,但提供更快的依赖解析和包安装,这使得它在处理复杂环境时更加高效。
Mamba的关键特点
- 快速的依赖解析:Mamba使用一个高效的C++库进行依赖解析,这使得在面对复杂的包依赖时能更快地找到解决方案。
- 并行下载:Mamba可以并行下载和安装包,这大大减少了安装时间,特别是在需要下载大量包的情况下。
- 与Conda兼容:Mamba可以无缝替代Conda的命令,你可以在几乎所有Conda命令中直接使用mamba来替换conda。
- 更好的用户体验:提供更直观的输出信息和进度条,让用户可以更清晰地了解安装进度和过程。
安装Mamba
要安装Mamba,你首先需要一个Conda环境。以下是在已有Conda环境中安装Mamba的步骤:
如果你希望在特定环境中安装Mamba,可以先激活该环境:
conda activate myenv
你可以通过Conda-Forge通道安装Mamba,因为Mamba在该通道上维护得很好:
conda install mamba -n base -c conda-forge
这里-n base表示将Mamba安装在base环境中,这样你可以在任何环境中使用Mamba。
使用Mamba
Mamba可以直接替代Conda的命令。以下是一些常见的Conda命令及其Mamba等效用法:
- 创建环境:mamba create –name myenv python=3.8
- 激活环境:conda activate myenv (Mamba不改变环境激活命令,你仍然使用Conda的激活命令)
- 安装包:mamba install numpy
- 更新包:mamba update numpy
- 删除包:mamba remove numpy
- 更新环境中的所有包:mamba update –all
优势:
- 速度:Mamba在处理包管理和环境解决时速度快得多,这对大环境尤其有用。
- 效率:并行下载和安装机制使得整体过程更加高效。
- 兼容性:能够无缝替代Conda,并与其生态系统兼容。
局限性:
- 新兴工具:作为一个较新的工具,Mamba可能在某些边缘情况下不如Conda稳定。
- 社区支持:虽然Mamba的社区在快速增长,但它仍然没有Conda那么成熟。
参考链接: