

大家好,我是正在实战各种AI项目的程序员晚枫。
欢迎来到Python数据分析课程!
这是第一课,我们将搭建专业的数据分析环境。使用Anaconda,你可以一键安装所有需要的工具,省去很多配置麻烦。
为什么选择Anaconda?
传统方式的痛点
1 2 3 4 5 6 7
| pip install numpy pip install pandas pip install matplotlib pip install jupyter pip install scikit-learn
|
Anaconda的优势
✅ 一键安装:包含180+科学计算包
✅ 环境管理:不同项目用不同环境,互不干扰
✅ 包管理:conda命令比pip更强大
✅ 跨平台:Windows/Mac/Linux都支持
安装Anaconda
下载
- 访问 https://www.anaconda.com/download
- 选择适合你系统的版本(推荐Python 3.10+)
- 下载安装包(约500MB)
Windows安装
- 双击安装包
- 重要:勾选"Add Anaconda to my PATH"
- 选择"Just Me"(个人使用)
- 等待安装完成(约5分钟)
Mac安装
1 2 3 4 5
| 双击.pkg文件,按提示安装
bash Anaconda3-2024.02-MacOSX-x86_64.sh
|
验证安装
打开终端,输入:
1 2 3 4 5
| conda --version
python --version
|
配置国内镜像源
由于网络原因,建议配置国内镜像,下载更快:
1 2 3 4 5 6 7 8
| conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --set show_channel_urls yes
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/main/
|
创建专属环境
为什么需要虚拟环境?
想象你有两个项目:
- 项目A需要pandas 1.0
- 项目B需要pandas 2.0
没有虚拟环境,它们会冲突。有了虚拟环境,各用各的。
创建数据分析环境
1 2 3 4 5 6 7 8
| conda create -n data python=3.10
conda activate data
(data) C:\Users\YourName>
|
安装核心包
1 2 3 4 5
| conda install numpy pandas matplotlib seaborn jupyter
conda install numpy pandas matplotlib seaborn jupyter openpyxl xlrd
|
Jupyter Notebook入门
启动Jupyter
1 2 3 4 5 6 7
| conda activate data
jupyter notebook
|
Jupyter界面介绍
- Files:文件浏览器
- Running:正在运行的Notebook
- New:新建文件(选Python 3)
第一个Notebook
1 2 3 4 5 6 7 8
| import pandas as pd import numpy as np
print("Pandas版本:", pd.__version__) print("NumPy版本:", np.__version__)
|
Jupyter常用快捷键
| 快捷键 | 功能 |
|---|
| Shift + Enter | 运行当前cell |
| Ctrl + Enter | 运行并停留在当前cell |
| A | 在上面插入cell |
| B | 在下面插入cell |
| DD | 删除cell |
| M | 切换为Markdown |
| Y | 切换为代码 |
VS Code配置(可选)
如果你更喜欢VS Code:
1. 安装插件
2. 选择解释器
按Ctrl+Shift+P,输入"Python: Select Interpreter"
选择带有(data)的环境
3. 创建.ipynb文件
新建文件,后缀改为.ipynb,即可使用Jupyter功能
环境管理常用命令
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
| conda env list
conda activate data conda deactivate
conda remove -n data --all
conda env export > environment.yml
conda env create -f environment.yml
conda list
conda update pandas
|
常见问题
Q1:安装后conda命令找不到
解决:手动添加环境变量
- Windows:添加
C:\Users\用户名\anaconda3\Scripts到PATH - Mac:
export PATH="/Users/用户名/anaconda3/bin:$PATH"
Q2:创建环境很慢
解决:已经配置了国内镜像还是慢,可以尝试:
1
| conda create -n data python=3.10 --offline
|
Q3:包安装失败
解决:conda不行就用pip
1
| pip install 包名 -i https://pypi.tuna.tsinghua.edu.cn/simple
|
性能对比:Anaconda vs 纯pip
| 对比项 | 纯pip安装 | Anaconda |
|---|
| 安装时间 | 30-60分钟 | 10分钟 |
| 依赖冲突 | 经常遇到 | conda自动解决 |
| 环境管理 | 需要virtualenv | 内置conda env |
1 2 3 4 5 6 7
| pip install numpy pandas matplotlib scipy scikit-learn
conda install numpy pandas matplotlib scipy scikit-learn
|
进阶用法
多环境管理最佳实践
实际工作中你肯定不止一个项目,学会管理多个环境是必修课:
1 2 3 4 5 6 7 8 9 10 11
| conda create --name data_v2 --clone data
conda env export > environment.yml
conda env create -f environment.yml
conda env remove -n old_project conda clean --all
|
Jupyter Notebook高级技巧
1 2 3 4 5 6 7 8 9 10 11 12 13
| %timeit sum(range(1000000)) %matplotlib inline %%writefile my_module.py
import pandas as pd pd.set_option('display.max_columns', None) pd.set_option('display.max_rows', 100)
%load_ext autoreload %autoreload 2
|
Jupyter Lab(Notebook升级版)
1 2 3
| conda install -c conda-forge jupyterlab jupyter lab
|
避坑指南
❌ 坑1:PATH环境变量没添加
Windows安装时如果忘了勾选"Add to PATH",命令行会提示"conda不是内部命令":
1 2 3 4 5 6 7 8 9 10
|
C:\Users\用户名\anaconda3 C:\Users\用户名\anaconda3\Scripts C:\Users\用户名\anaconda3\Library\bin
echo 'export PATH=/Users/用户名/anaconda3/bin:{home_bin}' >> ~/.zshrc source ~/.zshrc
|
❌ 坑2:conda安装太慢
1 2 3 4 5 6 7 8 9 10 11
| conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --set show_channel_urls yes
conda install mamba -c conda-forge mamba install numpy pandas
conda install numpy pandas pip install some_small_pkg
|
❌ 坑3:Jupyter内核丢失
1 2 3
| conda activate data pip install ipykernel python -m ipykernel install --user --name=data --display-name="Python (data)"
|
实战案例:为5人团队统一搭建环境
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
| conda create -n team_analysis python=3.10 conda activate team_analysis
conda install numpy=1.24 pandas=2.0 matplotlib seaborn scipy scikit-learn conda install jupyter openpyxl xlrd sqlalchemy pip install pyecharts python-office -i https://pypi.tuna.tsinghua.edu.cn/simple
conda env export > team_environment.yml
conda env create -f team_environment.yml conda activate team_analysis
|
这样5个人的团队只需要一个配置文件,3分钟统一环境,再也不用说"在我电脑上是好的"了。
Jupyter Notebook效率提升插件
1 2 3 4 5 6 7 8 9 10 11 12 13 14
| conda install -c conda-forge jupyter_contrib_nbextensions jupyter contrib nbextension install --user
pip install jupyterthemes jt -t grade3 -f fira -fs 13 -cellw 90% -ofs 11 -dfs 11 -T
|
远程访问Jupyter
1 2 3 4 5 6 7
| jupyter notebook --no-browser --port=8888 --ip=0.0.0.0
ssh -N -f -L 8888:localhost:8888 user@server_ip
|
环境迁移checklist
当你换了电脑或重装系统,如何快速恢复数据分析环境:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
| conda env export > environment.yml pip freeze > requirements.txt
conda env create -f environment.yml
conda create -n data python=3.10 conda activate data pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
python -c "import pandas; print(pandas.__version__)" python -c "import numpy; print(numpy.__version__)" python -c "import matplotlib; print(matplotlib.__version__)"
|
下节预告
下一课我们将学习NumPy基础,这是Python数值计算的基石。
你将学会:
👉 继续阅读:NumPy基础-数组操作
💬 加入学习交流群
扫码加入Python学习交流群,和数千名同学一起进步:
👉 点击加入交流群
群里不定期分享:
- 数据分析实战案例
- Python学习资料
- 求职面试经验
- 行业最新动态
推荐:AI Python数据分析实战营
🎁 限时福利:送《利用Python进行数据分析》实体书
👉 点击了解详情
课程导航
上一篇: Python数据分析课程大纲
下一篇: NumPy基础-数组操作
PS:工欲善其事,必先利其器。花10分钟配置好环境,后面的学习会顺畅很多。
📚 推荐教材
主教材:《Excel+Python 飞速搞定数据分析与处理(图灵出品)》
💬 联系我
主营业务:AI 编程培训、企业内训、技术咨询
🎓 AI 编程实战课程
想系统学习 AI 编程?程序员晚枫的 AI 编程实战课 帮你从零上手!