github star gitee star atomgit star PyPI Downloads AI 编程 AI 交流群

大家好,我是正在实战各种AI项目的程序员晚枫。

欢迎来到Python数据分析课程

这是第一课,我们将搭建专业的数据分析环境。使用Anaconda,你可以一键安装所有需要的工具,省去很多配置麻烦。


为什么选择Anaconda?

传统方式的痛点

1
2
3
4
5
6
7
# 不用Anaconda,你需要:
pip install numpy
pip install pandas
pip install matplotlib
pip install jupyter
pip install scikit-learn
# ... 几十个包,还要处理依赖冲突

Anaconda的优势

一键安装:包含180+科学计算包
环境管理:不同项目用不同环境,互不干扰
包管理:conda命令比pip更强大
跨平台:Windows/Mac/Linux都支持


安装Anaconda

下载

  1. 访问 https://www.anaconda.com/download
  2. 选择适合你系统的版本(推荐Python 3.10+)
  3. 下载安装包(约500MB)

Windows安装

  1. 双击安装包
  2. 重要:勾选"Add Anaconda to my PATH"
  3. 选择"Just Me"(个人使用)
  4. 等待安装完成(约5分钟)

Mac安装

1
2
3
4
5
# 方式1:图形界面安装
双击.pkg文件,按提示安装

# 方式2:命令行安装
bash Anaconda3-2024.02-MacOSX-x86_64.sh

验证安装

打开终端,输入:

1
2
3
4
5
conda --version
# 输出类似:conda 23.7.4

python --version
# 输出类似:Python 3.10.13

配置国内镜像源

由于网络原因,建议配置国内镜像,下载更快:

1
2
3
4
5
6
7
8
# 添加清华镜像
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

# 或者使用中科大镜像
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/main/

创建专属环境

为什么需要虚拟环境?

想象你有两个项目:

  • 项目A需要pandas 1.0
  • 项目B需要pandas 2.0

没有虚拟环境,它们会冲突。有了虚拟环境,各用各的。

创建数据分析环境

1
2
3
4
5
6
7
8
# 创建名为data的环境,Python 3.10
conda create -n data python=3.10

# 激活环境
conda activate data

# 看到前面有(data)就表示激活成功
(data) C:\Users\YourName>

安装核心包

1
2
3
4
5
# 在data环境中安装
conda install numpy pandas matplotlib seaborn jupyter

# 或者一次性安装多个
conda install numpy pandas matplotlib seaborn jupyter openpyxl xlrd

Jupyter Notebook入门

启动Jupyter

1
2
3
4
5
6
7
# 确保在data环境中
conda activate data

# 启动
jupyter notebook

# 会自动打开浏览器,地址是 http://localhost:8888

Jupyter界面介绍

  • Files:文件浏览器
  • Running:正在运行的Notebook
  • New:新建文件(选Python 3)

第一个Notebook

1
2
3
4
5
6
7
8
# 在cell中输入
import pandas as pd
import numpy as np

print("Pandas版本:", pd.__version__)
print("NumPy版本:", np.__version__)

# 按Shift+Enter运行

Jupyter常用快捷键

快捷键功能
Shift + Enter运行当前cell
Ctrl + Enter运行并停留在当前cell
A在上面插入cell
B在下面插入cell
DD删除cell
M切换为Markdown
Y切换为代码

VS Code配置(可选)

如果你更喜欢VS Code:

1. 安装插件

  • Python
  • Jupyter

2. 选择解释器

Ctrl+Shift+P,输入"Python: Select Interpreter"
选择带有(data)的环境

3. 创建.ipynb文件

新建文件,后缀改为.ipynb,即可使用Jupyter功能


环境管理常用命令

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
# 查看所有环境
conda env list

# 切换环境
conda activate data
conda deactivate

# 删除环境
conda remove -n data --all

# 导出环境配置
conda env export > environment.yml

# 从配置文件创建环境
conda env create -f environment.yml

# 查看当前环境的包
conda list

# 更新包
conda update pandas

常见问题

Q1:安装后conda命令找不到

解决:手动添加环境变量

  • Windows:添加C:\Users\用户名\anaconda3\Scripts到PATH
  • Mac:export PATH="/Users/用户名/anaconda3/bin:$PATH"

Q2:创建环境很慢

解决:已经配置了国内镜像还是慢,可以尝试:

1
conda create -n data python=3.10 --offline

Q3:包安装失败

解决:conda不行就用pip

1
pip install 包名 -i https://pypi.tuna.tsinghua.edu.cn/simple

性能对比:Anaconda vs 纯pip

对比项纯pip安装Anaconda
安装时间30-60分钟10分钟
依赖冲突经常遇到conda自动解决
环境管理需要virtualenv内置conda env
1
2
3
4
5
6
7
# pip方式(可能遇到编译错误)
pip install numpy pandas matplotlib scipy scikit-learn
# 某个包编译失败 → 手动安装C++编译器 → 继续尝试...

# conda方式(一条命令搞定)
conda install numpy pandas matplotlib scipy scikit-learn
# 自动解决依赖,预编译二进制包

进阶用法

多环境管理最佳实践

实际工作中你肯定不止一个项目,学会管理多个环境是必修课:

1
2
3
4
5
6
7
8
9
10
11
# 克隆环境(复制一个已有环境)
conda create --name data_v2 --clone data

# 导出环境(分享给同事)
conda env export > environment.yml
# 同事一行命令还原
conda env create -f environment.yml

# 清理无用环境释放空间
conda env remove -n old_project
conda clean --all

Jupyter Notebook高级技巧

1
2
3
4
5
6
7
8
9
10
11
12
13
# 魔法命令(Jupyter专属)
%timeit sum(range(1000000)) # 计时
%matplotlib inline # 内嵌显示图表
%%writefile my_module.py # 把cell内容写入文件

# 显示所有列
import pandas as pd
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', 100)

# 自动重载模块
%load_ext autoreload
%autoreload 2

Jupyter Lab(Notebook升级版)

1
2
3
conda install -c conda-forge jupyterlab
jupyter lab
# 优势:左侧文件浏览器、多标签页、内置终端、更好的代码补全

避坑指南

❌ 坑1:PATH环境变量没添加

Windows安装时如果忘了勾选"Add to PATH",命令行会提示"conda不是内部命令":

1
2
3
4
5
6
7
8
9
10
# Windows手动添加PATH
# 控制面板 → 系统 → 高级系统设置 → 环境变量 → Path
# 添加:
C:\Users\用户名\anaconda3
C:\Users\用户名\anaconda3\Scripts
C:\Users\用户名\anaconda3\Library\bin

# Mac/Linux
echo 'export PATH=/Users/用户名/anaconda3/bin:{home_bin}' >> ~/.zshrc
source ~/.zshrc

❌ 坑2:conda安装太慢

1
2
3
4
5
6
7
8
9
10
11
# 方案1:配置国内镜像
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes

# 方案2:使用mamba(更快的conda替代品)
conda install mamba -c conda-forge
mamba install numpy pandas # 比conda快5-10倍

# 方案3:混合使用conda和pip
conda install numpy pandas # 核心包用conda
pip install some_small_pkg # 小包用pip

❌ 坑3:Jupyter内核丢失

1
2
3
conda activate data
pip install ipykernel
python -m ipykernel install --user --name=data --display-name="Python (data)"

实战案例:为5人团队统一搭建环境

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# Step 1: 创建团队统一环境
conda create -n team_analysis python=3.10
conda activate team_analysis

# Step 2: 安装所有需要的包
conda install numpy=1.24 pandas=2.0 matplotlib seaborn scipy scikit-learn
conda install jupyter openpyxl xlrd sqlalchemy
pip install pyecharts python-office -i https://pypi.tuna.tsinghua.edu.cn/simple

# Step 3: 导出环境配置文件
conda env export > team_environment.yml

# Step 4: 团队成员一键安装
conda env create -f team_environment.yml
conda activate team_analysis

这样5个人的团队只需要一个配置文件,3分钟统一环境,再也不用说"在我电脑上是好的"了。

Jupyter Notebook效率提升插件

1
2
3
4
5
6
7
8
9
10
11
12
13
14
# 安装jupyter_contrib_nbextensions
conda install -c conda-forge jupyter_contrib_nbextensions
jupyter contrib nbextension install --user

# 推荐插件:
# - Hinterland:代码自动补全
# - Table of Contents:自动生成目录
# - ExecuteTime:显示每个cell的执行时间
# - Variable Inspector:变量查看器
# - Autopep8:代码格式化

# 安装Jupyter主题
pip install jupyterthemes
jt -t grade3 -f fira -fs 13 -cellw 90% -ofs 11 -dfs 11 -T

远程访问Jupyter

1
2
3
4
5
6
7
# 在服务器上启动Jupyter,本地浏览器访问
jupyter notebook --no-browser --port=8888 --ip=0.0.0.0

# 本地SSH端口转发
ssh -N -f -L 8888:localhost:8888 user@server_ip

# 然后在本地浏览器访问 http://localhost:8888

环境迁移checklist

当你换了电脑或重装系统,如何快速恢复数据分析环境:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# 1. 在旧电脑导出环境
conda env export > environment.yml
pip freeze > requirements.txt

# 2. 在新电脑安装
conda env create -f environment.yml
# 或
conda create -n data python=3.10
conda activate data
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

# 3. 验证关键包
python -c "import pandas; print(pandas.__version__)"
python -c "import numpy; print(numpy.__version__)"
python -c "import matplotlib; print(matplotlib.__version__)"

下节预告

下一课我们将学习NumPy基础,这是Python数值计算的基石。

你将学会:

  • 创建和操作数组
  • 数组运算和广播
  • 常用的数学函数

👉 继续阅读:NumPy基础-数组操作


💬 加入学习交流群

扫码加入Python学习交流群,和数千名同学一起进步:

👉 点击加入交流群

群里不定期分享:

  • 数据分析实战案例
  • Python学习资料
  • 求职面试经验
  • 行业最新动态

推荐:AI Python数据分析实战营

🎁 限时福利:送《利用Python进行数据分析》实体书

👉 点击了解详情


课程导航

上一篇: Python数据分析课程大纲

下一篇: NumPy基础-数组操作


PS:工欲善其事,必先利其器。花10分钟配置好环境,后面的学习会顺畅很多。



📚 推荐教材

主教材《Excel+Python 飞速搞定数据分析与处理(图灵出品)》

💬 联系我

平台账号/链接
微信扫码加好友
微博@程序员晚枫
知乎@程序员晚枫
抖音@程序员晚枫
小红书@程序员晚枫
B 站Python 自动化办公社区

主营业务:AI 编程培训、企业内训、技术咨询

🎓 AI 编程实战课程

想系统学习 AI 编程?程序员晚枫的 AI 编程实战课 帮你从零上手!