第 15 讲：类元编程——元类与类创建过程详解

2026-03-03

元类是类的类，掌握它，你就能控制类的创建过程，实现强大的框架功能。

🎯 元类基础

type 是元类

# type 是 Python 的内置元类
class MyClass:
    pass

print(type(MyClass))  # <class 'type'>

自定义元类

class SingletonMeta(type):
    """单例元类"""
    _instances = {}
    
    def __call__(cls, *args, **kwargs):
        if cls not in cls._instances:
            cls._instances[cls] = super().__call__(*args, **kwargs)
        return cls._instances[cls]

class Database(metaclass=SingletonMeta):
    def __init__(self, connection_string):
        self.connection_string = connection_string

# 使用
db1 = Database("postgresql://localhost")
db2 = Database("mysql://remote")
print(db1 is db2)  # True - 同一个实例

🔧 new和init

自动注册模式

class AutoRegisterMeta(type):
    """自动注册子类的元类"""
    registry = {}
    
    def __new__(mcs, name, bases, namespace):
        cls = super().__new__(mcs, name, bases, namespace)
        if name != 'BasePlugin':  # 不注册基类
            mcs.registry[name] = cls
        return cls

class BasePlugin(metaclass=AutoRegisterMeta):
    pass

class EmailPlugin(BasePlugin):
    pass

class SMSPlugin(BasePlugin):
    pass

print(AutoRegisterMeta.registry)  # {'EmailPlugin': ..., 'SMSPlugin': ...}

🎯 本讲总结

元类：控制类的创建过程。

type：Python 的内置元类。

实际应用场景：单例模式、自动注册、ORM 框架。

学习路线： 零基础 → 《从入门到实践》 → 《流畅的 Python》 → 本门课程 → 《CPython 设计与实现》

🔗 课程导航

← 上一讲：动态属性和特性 | 下一讲：类型提示 →

💬 联系我

平台	账号/链接
微信	扫码加好友
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

展开全文 >>

第 1 讲：CPython 概览与源码编译——开启解释器源码探索之旅

2026-03-03

当你写下 print("Hello World")，按下回车的那一刻，计算机内部究竟发生了什么？

这行看似简单的代码，在 CPython 解释器内部经历了一场复杂而精妙的旅程。从你键盘敲下的字符，到屏幕上显示的绿色文字，中间经过了词法分析、语法分析、编译成字节码、虚拟机执行等多个阶段。理解这个过程，是掌握 Python 底层原理的第一步。

想象一下，你是一位翻译官。有人给你一句中文”你好世界”，你需要把它翻译成英文”Hello World”。这个翻译过程大致分为几步：首先理解每个词的含义，然后理解句子的语法结构，最后用目标语言重新组织表达。CPython 的工作与此类似，只不过它翻译的是从人类可读的 Python 代码到机器可执行的字节码。

🏗️ CPython 整体架构：从源代码到执行结果

CPython 是 Python 语言的参考实现，也是世界上使用最广泛的 Python 解释器。它由荷兰程序员 Guido van Rossum 于 1991 年创建，名字中的”C”表示它是用 C 语言编写的。这个选择非常明智——C 语言既足够底层可以操作系统资源，又足够高级便于人类编写和维护。

解释器的工作流程

让我们用更通俗的方式来理解 CPython 的工作流程：

第一步：词法分析
源代码字符流 → Token 序列
（把代码"切"成有意义的单词）

第二步：语法分析
Token 序列 → 抽象语法树 (AST)
（理解单词如何组成句子）

第三步：编译
抽象语法树 → 字节码
（把句子翻译成中间语言）

第四步：执行
字节码 → 执行结果
（运行中间语言得到结果）

这个流程设计得非常精妙。为什么需要这么多步骤？直接执行源代码不行吗？

答案是：可以，但效率很低。早期的 BASIC 解释器就是这么做的——逐行读取、解析、执行。但这种方式有个致命缺陷：循环中的代码每次执行都要重新解析一遍。想象一下，一个执行 1000 次的 for 循环，里面的代码就要被解析 1000 次，这是巨大的浪费。

CPython 采用编译 + 执行的两阶段模式，完美解决了这个问题。代码只编译一次，生成的字节码可以重复执行。这也是为什么 Python 程序第二次运行通常会更快——字节码可以被缓存到.pyc 文件中。

各组件的职责详解

词法分析器（Tokenizer） 是整个流程的第一道工序。它的任务非常简单但重要：把连续的字符流切成一个个有意义的”单词”，也就是 Token。比如 x = 1 + 2 这行代码，会被切成 NAME(x)、EQ(=)、NUMBER(1)、PLUS(+)、NUMBER(2) 五个 Token。

这个过程看似简单，实则有很多细节需要处理。比如如何区分 ==（比较运算符）和两个单独的 =（赋值运算符）？如何处理字符串中的转义字符？如何识别 Python 特有的缩进结构？Tokenizer 需要处理所有这些边界情况。

语法分析器（Parser） 接收 Token 序列，输出抽象语法树（AST）。如果说词法分析是”认字”，那么语法分析就是”造句”。它要判断这些 Token 组成的句子是否符合 Python 的语法规则。

比如 x = 1 + 这个句子，词法分析没问题，但语法分析会报错——加号后面缺少操作数。语法分析器不仅要检查语法正确性，还要构建出能反映代码语义结构的 AST。

编译器（Compiler） 将 AST 转换成字节码。字节码是一种中间语言，比机器码抽象，但比源代码更接近机器。它的设计目标是在可读性和执行效率之间取得平衡。

虚拟机（VM） 是最后一步，负责执行字节码。CPython 使用的是栈式虚拟机，这意味着它使用栈数据结构来管理运算过程中的临时值。这种设计简单、可靠，是许多解释器的首选方案。

📁 源码目录结构：一座精心设计的城市

如果把 CPython 源码比作一座城市，那么每个目录就是一个功能区。理解这个”城市”的规划，是探索源码的第一步。

cpython/
├── Include/          # 头文件目录（城市的"规划局"）
│   ├── Python.h      # 主头文件
│   ├── object.h      # 对象模型定义
│   └── ...
├── Objects/          # 内置类型的 C 实现（"工厂区"）
│   ├── listobject.c  # 列表实现
│   ├── dictobject.c  # 字典实现
│   └── ...
├── Python/           # 解释器核心（"总装车间"）
│   ├── ceval.c       # 虚拟机主循环
│   ├── compile.c     # 编译器
│   └── ...
├── Parser/           # 词法和语法分析（"质检部门"）
│   ├── tokenizer.c   # 词法分析器
│   └── parser.c      # 语法分析器
├── Modules/          # 标准库模块的 C 实现
│   ├── gcmodule.c    # 垃圾回收
│   └── ...
├── Lib/              # 标准库的 Python 实现
├── Grammar/          # 语法定义文件
└── Programs/         # 可执行程序入口

核心区域详解

Include 目录 存放所有的头文件。头文件定义了 CPython 的”公共接口”——各种结构体、宏、函数声明。最重要的文件是 Python.h，它是编写 Python 扩展模块时必须包含的头文件。

可以把 Include 目录想象成城市的”规划局”，这里存放着所有建筑的蓝图。任何想要与 CPython 交互的代码，都需要先了解这些蓝图。

Objects 目录 包含所有内置类型的 C 语言实现。列表、字典、字符串、整数……你在 Python 中使用的每一个类型，都在这里有一个对应的.c 文件。比如 listobject.c 实现了列表类型，dictobject.c 实现了字典类型。

这个目录是 CPython 的”工厂区”，所有 Python 对象都在这里被制造出来。理解 Objects 目录，你就理解了 Python 对象的本质。

Python 目录 是解释器的核心。这里包含了编译器（compile.c）、虚拟机（ceval.c）、解释器状态管理（pystate.c）等关键组件。如果把 CPython 比作一家工厂，Python 目录就是”总装车间”——所有零部件在这里组装成最终产品。

Parser 目录 包含词法分析器和语法分析器的实现。这是 CPython 的”质检部门”——所有进入的代码都要在这里接受检查，确保语法正确。

为什么这样组织？

这种目录结构不是随意设计的，它反映了软件工程的经典原则：关注点分离。

目录	职责	比喻
Include	定义数据结构和接口	规划局
Objects	实现各种数据类型	工厂区
Python	实现核心逻辑	总装车间
Parser	检查语法正确性	质检部门
Modules	提供扩展功能	外部协作

理解这个组织结构，你在浏览源码时就不会迷失方向。想找列表的实现？去 Objects 目录。想看字节码怎么执行？去 Python 目录。

🔧 从源码编译：亲手打造你的 Python

阅读源码最好的方式不是”看”，而是”玩”。编译一个调试版本的 Python，设置断点，单步执行，观察变量的变化——这种体验比读十遍源码都有效。

为什么需要调试版本？

平时我们从官网下载的 Python 是”发布版本”，经过了各种优化。而”调试版本”包含了额外的调试信息，可以在关键位置打印日志，帮助理解内部运行机制。

编译调试版本的关键参数是 --with-pydebug。这个参数会启用一系列调试功能：

# 下载源码
git clone https://github.com/python/cpython.git
cd cpython

# 配置调试版本
./configure --with-pydebug --prefix=/opt/python3.11-debug

# 编译（使用 8 个线程加速）
make -j8

# 运行测试
make test

# 安装（可选）
sudo make install

编译过程的本质

编译 CPython 的过程，本质上是将 C 源代码转换成机器可执行文件的过程。这个过程分为三步：

预处理：处理所有的宏定义和包含指令。比如 #include <Python.h> 会被替换成 Python.h 的实际内容。

编译：将预处理后的 C 代码转换成汇编代码，再转换成目标文件（.o 文件）。每个.c 文件都会生成一个对应的.o 文件。

链接：将所有目标文件和依赖库链接在一起，生成最终的可执行文件。

这个过程看似复杂，但 Makefile 已经帮我们处理好了所有细节。我们只需要运行 make 命令即可。

常见问题与解决

编译过程中可能遇到各种问题，以下是几种常见情况：

缺少依赖库：如果提示找不到某个头文件或库文件，通常是因为缺少开发包。比如在 Ubuntu 上，需要安装 libssl-dev、zlib1g-dev 等包。

# Ubuntu/Debian 安装依赖
sudo apt-get install -y build-essential libssl-dev zlib1g-dev \
    libbz2-dev libreadline-dev libsqlite3-dev wget curl llvm \
    libncurses5-dev libncursesw5-dev xz-utils tk-dev libffi-dev \
    liblzma-dev python-openssl git

编译失败：如果编译过程中出现错误，首先检查错误信息。大多数情况下是因为缺少依赖或者版本不兼容。

测试失败：make test 可能会有一些测试失败，这通常是正常的。CPython 的测试套件非常庞大，某些测试可能因为环境差异而失败。

🐛 调试环境搭建：与源码”对话”

编译完成后，下一步是搭建调试环境。GDB 是 Linux 下最常用的调试工具，它可以让你单步执行 C 代码，查看变量值，设置断点。

GDB 基础使用

启动 GDB 后，常用的命令包括：

# 启动 GDB
gdb ./python

# 设置断点
(gdb) break PyLong_FromLong

# 运行程序
(gdb) run -c "x = 100"

# 单步执行
(gdb) next
(gdb) step

# 查看变量
(gdb) print op
(gdb) bt  # 显示调用栈

这些命令可以让你像”时间旅行者”一样，在代码执行过程中暂停、观察、继续。

调试实战：追踪一个整数对象

让我们设计一个具体的调试场景：追踪整数对象 100 从创建到销毁的完整生命周期。

首先，在 PyLong_FromLong 函数设置断点。这个函数负责创建整数对象。然后运行一个简单的 Python 脚本 x = 100。

当断点触发时，你可以：

查看参数 ival 的值（应该是 100）
单步执行，观察内存分配过程
查看返回的对象结构
继续执行，观察对象何时被销毁

这种调试体验是无价的。通过亲眼看到代码如何执行，你对 CPython 的理解会从”知道”升级为”理解”。

💡 第一个源码实验：小整数缓存机制

理论学习需要实践来巩固。让我们设计一个简单的实验，验证 CPython 的小整数缓存机制。

现象观察

在 Python 交互环境中执行以下代码：

# 小整数（-5 到 256）被缓存
a = 100
b = 100
print(a is b)  # True，同一个对象

# 大整数不被缓存
c = 1000
d = 1000
print(c is d)  # False，不同对象

为什么 100 的 is 比较返回 True，而 1000 返回 False？这背后是 CPython 的优化策略。

原理解析

CPython 发现，程序中频繁使用的小整数（-5 到 256）总是被重复创建和销毁。为了优化这种情况，解释器在启动时就预先创建了这些整数对象，并缓存起来。每次需要这些小整数时，直接返回缓存的对象，而不是创建新对象。

这个优化有两个好处：

节省内存：避免重复创建相同的小整数
提升性能：省去了内存分配和初始化的开销

源码验证

如果你想从源码层面验证这个机制，可以查看 Objects/longobject.c 文件中的 PyLong_FromLong 函数。你会看到类似这样的代码：

// 检查是否在小整数范围内
if (-NSMALLNEGINTS <= ival && ival < NSMALLPOSINTS) {
    // 直接返回缓存的对象
    return small_ints[ival + NSMALLNEGINTS];
}
// 大整数需要新建

这段代码清晰地展示了小整数缓存的逻辑。

🎯 本讲总结

通过本讲，我们建立了 CPython 的整体认知框架：

架构层面：理解了从源代码到执行结果的完整流程，以及每个组件的职责。

组织层面：了解了源码目录的结构设计原则，知道去哪里找什么内容。

实践层面：掌握了从源码编译和调试的方法，可以亲手探索 CPython 的内部机制。

实验层面：通过小整数缓存实验，学会了如何从现象追溯到源码实现。

这些知识是后续学习的基础。下一讲我们将深入 Python 对象模型，理解”一切皆对象”的底层实现。

📚 推荐教材

《Python 编程从入门到实践（第 3 版）》 - Eric Matthes 著

Python 零基础入门首选。本书分为基础语法和项目实战两部分，适合完全没有编程经验的读者。学完可掌握 Python 基础，为后续进阶打下坚实基础。

《流畅的 Python（第 2 版）》 - Luciano Ramalho 著

Python 进阶经典之作。深入讲解 Python 的高级特性，包括数据模型、函数式编程、面向对象、元编程等。建议在掌握基础后阅读，为学习 CPython 源码做好准备。

《CPython 设计与实现》 - Anthony Shaw 著

本书深入讲解 CPython 内部机制，从内存管理到字节码执行，从对象模型到并发编程。配合本课程学习，效果更佳。

学习路线建议：

1	零基础 → 《从入门到实践》 → 《流畅的 Python》 → 本门课程 → 《CPython 设计与实现》

🔗 课程导航

← 课程大纲 | 下一讲：Python 对象模型深度解析 →

💬 联系我

平台	账号/链接
微信	扫码加好友
微博	@程序员晚枫
知乎	@程序员晚枫
抖音	@程序员晚枫
小红书	@程序员晚枫
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

展开全文 >>

第 14 讲：动态属性和特性——运行时行为控制与内存优化

2026-03-03

动态创建属性、拦截属性访问、减少内存占用，这些高级技巧让你的代码更灵活。

🎯 getattr和getattribute

延迟加载

class LazyObject:
    """延迟加载属性"""
    def __init__(self):
        self._data = {}
    
    def __getattr__(self, name):
        """属性不存在时调用"""
        if name.startswith('load_'):
            key = name[5:]  # load_data -> data
            value = f"Loaded {key}"
            setattr(self, name, value)
            return value
        raise AttributeError(f"'{self.__class__.__name__}' has no attribute '{name}'")

obj = LazyObject()
print(obj.load_user)  # Loaded user
print(obj.load_user)  # 从缓存读取，不再调用__getattr__

区别

方法	触发时机
`__getattr__`	属性不存在时
`__getattribute__`	每次访问属性时

💾 slots内存优化

使用示例

# 普通类（使用__dict__）
class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age

# 使用__slots__（节省内存）
class EfficientPerson:
    __slots__ = ['name', 'age']  # 预定义属性
    
    def __init__(self, name, age):
        self.name = name
        self.age = age

# 效果：数百万实例时可节省大量内存
import sys
p1 = Person("Alice", 30)
p2 = EfficientPerson("Alice", 30)
print(sys.getsizeof(p1))  # 约 56 字节
print(sys.getsizeof(p2))  # 约 40 字节

何时使用slots

创建大量实例
属性固定
内存敏感场景

🎯 本讲总结

getattr：属性不存在时调用。

getattribute：每次访问属性时调用。

slots：预定义属性，节省内存。

学习路线： 零基础 → 《从入门到实践》 → 《流畅的 Python》 → 本门课程 → 《CPython 设计与实现》

🔗 课程导航

← 上一讲：描述符 | 下一讲：类元编程 →

💬 联系我

平台	账号/链接
微信	扫码加好友
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

展开全文 >>

CPython 设计与实现 - 20 讲 Python 解释器底层原理实战课

2026-03-03

CPython 设计与实现 - 20 讲 Python 解释器底层原理实战课

📚 课程简介

本课程带你深入 CPython 解释器源码，理解 Python 代码是如何被编译、执行和管理的。适合想从”会用 Python”进阶到”理解 Python”的开发者。

适合人群：

✅ 有 3 年以上 Python 使用经验的开发者
✅ 想深入理解 Python 内部工作原理
✅ 准备面试高级/专家 Python 岗位
✅ 想参与 CPython 开源项目贡献
✅ 对编译原理和解释器设计感兴趣

学完你将掌握：

🎯 CPython 解释器的整体架构
🎯 Python 对象的底层 C 实现
🎯 字节码编译和执行机制
🎯 内存管理和垃圾回收原理
🎯 GIL 全局解释器锁的工作机制
🎯 模块导入和包管理机制
🎯 多线程和多进程底层实现
🎯 性能分析和优化技巧

📖 课程目录（20 讲）

第一部分：CPython 基础（第 1-4 讲）

第 1 讲：CPython 解释器概览

CPython 项目结构
源码目录组织
编译和安装 CPython
调试工具介绍

第 2 讲：Python 对象模型

PyObject 结构体
引用计数机制
类型对象系统
对象的创建和销毁

第 3 讲：内存管理基础

Python 内存池
小对象分配器
大对象分配
内存对齐和优化

第 4 讲：垃圾回收机制

引用计数垃圾回收
循环垃圾回收
分代回收算法
GC 调优技巧

第二部分：编译与执行（第 5-9 讲）

第 5 讲：词法分析

Tokenizer 工作原理
词法单元类型
缩进处理机制
编码检测和处理

第 6 讲：语法分析

LL(1) 文法
抽象语法树（AST）
语法树遍历
自定义语法扩展

第 7 讲：字节码编译

编译器架构
符号表生成
字节码生成过程
优化策略

第 8 讲：字节码执行

虚拟机架构
栈帧结构
指令执行循环
特殊指令处理

第 9 讲：常见字节码指令解析

LOAD_NAME/STORE_NAME
CALL_FUNCTION
BUILD_LIST/BUILD_DICT
控制流指令

第三部分：核心对象实现（第 10-13 讲）

第 10 讲：数字类型实现

PyLongObject 大整数
PyFloatObject 浮点数
数值运算实现
精度和溢出处理

第 11 讲：字符串类型实现

PyUnicodeObject 结构
字符串编码存储
字符串操作优化
驻留机制

第 12 讲：容器类型实现

PyListObject 列表
PyDictObject 字典
PyTupleObject 元组
PySetObject 集合

第 13 讲：函数与类实现

PyFunctionObject 函数对象
PyMethodObject 方法对象
PyClassObject 类对象
描述符协议实现

第四部分：运行时系统（第 14-17 讲）

第 14 讲：栈帧与调用约定

PyFrameObject 栈帧
局部变量存储
函数调用约定
生成器帧实现

第 15 讲：GIL 全局解释器锁

GIL 的作用
锁获取和释放
I/O 操作时的 GIL
多核 CPU 影响

第 16 讲：线程与并发

Python 线程实现
线程调度机制
线程安全原语
并发编程最佳实践

第 17 讲：模块导入系统

导入机制流程
模块缓存
导入钩子
自定义导入器

第五部分：高级主题（第 18-20 讲）

第 18 讲：C 扩展编程

C API 基础
编写 C 扩展模块
类型转换
性能优化

第 19 讲：性能分析与优化

cProfile 原理
性能瓶颈定位
代码优化技巧
JIT 编译简介

第 20 讲：CPython 贡献指南

源码阅读技巧
Bug 提交流程
PR 编写指南
社区参与方式

📚 推荐教材

主教材：《CPython 设计与实现》

辅助资源：

CPython 官方源码：https://github.com/python/cpython
Python 开发者指南：https://devguide.python.org/

💬 联系我

平台	账号/链接
微信	扫码加好友
微博	@程序员晚枫
知乎	@程序员晚枫
抖音	@程序员晚枫
小红书	@程序员晚枫
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

📅 更新计划

2026 年 3 月：发布第 1-5 讲
2026 年 4 月：发布第 6-10 讲
2026 年 5 月：发布第 11-15 讲
2026 年 6 月：发布第 16-20 讲

程序员晚枫 专注 AI 编程培训，带你从入门到精通。

展开全文 >>

第 13 讲：描述符——属性访问的魔法与 ORM 原理

2026-03-03

描述符是 Python 属性访问的核心机制，理解它，你就理解了 property 和 ORM 的原理。

🎯 描述符协议

验证描述符

class Validator:
    """验证描述符"""
    def __init__(self, min_value, max_value):
        self.min_value = min_value
        self.max_value = max_value
    
    def __set_name__(self, owner, name):
        self.name = name
        self.storage_name = f'_{name}'
    
    def __get__(self, instance, owner):
        if instance is None:
            return self
        return getattr(instance, self.storage_name)
    
    def __set__(self, instance, value):
        if not (self.min_value <= value <= self.max_value):
            raise ValueError(f'{self.name} must be between {self.min_value} and {self.max_value}')
        setattr(instance, self.storage_name, value)

class Person:
    age = Validator(0, 150)
    salary = Validator(0, 1000000)
    
    def __init__(self, age, salary):
        self.age = age
        self.salary = salary

# 使用
p = Person(25, 50000)
p.age = 200  # ValueError: age must be between 0 and 150

描述符协议

方法	作用	触发场景
`__get__`	获取属性值	obj.attr
`__set__`	设置属性值	obj.attr = value
`__delete__`	删除属性	del obj.attr

🎯 本讲总结

描述符协议：__get__、__set__、__delete__。

验证描述符：实现属性验证逻辑。

实际应用：property、ORM 字段验证。

学习路线： 零基础 → 《从入门到实践》 → 《流畅的 Python》 → 本门课程 → 《CPython 设计与实现》

🔗 课程导航

← 上一讲：接口与协议 | 下一讲：动态属性和特性 →

💬 联系我

平台	账号/链接
微信	扫码加好友
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

展开全文 >>

第 12 讲：接口与协议——Python 式的抽象设计

2026-03-03

Python 的抽象不是强制，而是约定。理解 ABC 和 Protocol，写出更灵活的代码。

🎯 抽象基类 ABC

基础用法

from abc import ABC, abstractmethod

class Animal(ABC):
    @abstractmethod
    def speak(self):
        pass
    
    @abstractmethod
    def move(self):
        pass

class Dog(Animal):
    def speak(self):
        return "Woof!"
    
    def move(self):
        return "Running"

# animal = Animal()  # 错误！不能实例化抽象类
dog = Dog()  # 必须实现所有抽象方法

何时使用 ABC

需要强制子类实现某些方法
需要运行时类型检查
框架开发

📋 Protocol 类型提示

结构子类型

from typing import Protocol

class Drawable(Protocol):
    """绘制协议"""
    def draw(self) -> None:
        ...

class Circle:
    def draw(self) -> None:
        print("Drawing circle")

class Square:
    def draw(self) -> None:
        print("Drawing square")

def render(shape: Drawable):
    shape.draw()

# 任何实现了 draw 方法的对象都可以
render(Circle())
render(Square())

Protocol vs ABC

特性	ABC	Protocol
检查时机	运行时	静态类型检查
强制实现	是	否
灵活性	低	高

🎯 本讲总结

抽象基类：强制子类实现某些方法。

Protocol：结构子类型，静态类型检查。

ABC vs Protocol：运行时 vs 静态检查。

学习路线： 零基础 → 《从入门到实践》 → 《流畅的 Python》 → 本门课程 → 《CPython 设计与实现》

🔗 课程导航

← 上一讲：继承与组合 | 下一讲：描述符 →

💬 联系我

平台	账号/链接
微信	扫码加好友
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

展开全文 >>

第 11 讲：继承与组合——代码复用的艺术与 MRO 机制

2026-03-03

优先使用组合而非继承，但继承也有其用武之地。

🧬 MRO 方法解析顺序

多重继承

class A:
    def method(self):
        print("A")

class B(A):
    def method(self):
        print("B")

class C(A):
    def method(self):
        print("C")

class D(B, C):  # 多重继承
    pass

print(D.__mro__)  # (<class D>, <class B>, <class C>, <class A>)
d = D()
d.method()  # B - 按 MRO 顺序查找

查看 MRO

# 方法 1
print(ClassName.__mro__)

# 方法 2
print(ClassName.mro())

🔧 Mixin 模式

什么是 Mixin？

Mixin 是一种特殊的类，用于提供可选的功能，而不是表示”是一个”的关系。

实现示例

class JSONSerializableMixin:
    """提供 JSON 序列化功能的 Mixin"""
    def to_json(self):
        import json
        return json.dumps(self.__dict__)

class ComparableMixin:
    """提供比较功能的 Mixin"""
    def __eq__(self, other):
        return self.__dict__ == other.__dict__
    
    def __ne__(self, other):
        return not self.__eq__(other)

class User(JSONSerializableMixin, ComparableMixin):
    def __init__(self, name, age):
        self.name = name
        self.age = age

u = User("Alice", 30)
print(u.to_json())  # {"name": "Alice", "age": 30}

⚖️ 继承 vs 组合

何时使用继承

确实是”is-a”关系
需要多态
框架要求

何时使用组合

“has-a”关系
需要灵活性
避免紧耦合

# 继承（不推荐）
class Duck:
    def quack(self):
        print("Quack!")

class RubberDuck(Duck):  # 橡皮鸭不会叫！
    pass

# 组合（推荐）
class QuackBehavior:
    def quack(self):
        print("Quack!")

class SqueakBehavior:
    def quack(self):
        print("Squeak!")

class Duck:
    def __init__(self, quack_behavior):
        self.quack_behavior = quack_behavior
    
    def perform_quack(self):
        self.quack_behavior.quack()

🎯 本讲总结

MRO：方法解析顺序，C3 算法。

Mixin 模式：提供可选功能的类。

继承 vs 组合：优先使用组合。

学习路线： 零基础 → 《从入门到实践》 → 《流畅的 Python》 → 本门课程 → 《CPython 设计与实现》

🔗 课程导航

← 上一讲：序列和多态 | 下一讲：接口与协议 →

💬 联系我

平台	账号/链接
微信	扫码加好友
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

展开全文 >>

第 10 讲：序列和多态——自定义序列类型与鸭子类型

2026-03-03

让自己的类支持索引、切片、迭代，像内置列表一样好用！

🎯 实现自定义序列

扑克牌示例

class Deck:
    """一副扑克牌"""
    ranks = [str(n) for n in range(2, 11)] + list('JQKA')
    suits = '♠♥♦♣'
    
    def __init__(self):
        self._cards = [
            (rank, suit) for suit in self.suits
            for rank in self.ranks
        ]
    
    def __len__(self):
        return len(self._cards)
    
    def __getitem__(self, position):
        return self._cards[position]

# 使用
deck = Deck()
print(len(deck))      # 52
print(deck[0])        # ('2', '♠')
print(deck[:5])       # 切片支持
for card in deck:     # 迭代支持
    print(card)

支持的运算

实现 __len__和__getitem__ 后，自动支持：

len() 函数
索引访问（deck[0]）
切片（deck[:5]）
for 循环
in 运算符
reversed()
排序

🦆 鸭子类型

概念

# 不关注类型，只关注行为
def print_length(obj):
    print(len(obj))  # 任何有__len__的对象都可以

print_length([1, 2, 3])
print_length("hello")
print_length({'a': 1, 'b': 2})

Python 式的抽象

Python 不要求类继承特定的基类，只要实现了需要的协议（方法），就可以像那个类型一样使用。

# 只要实现了__iter__和__next__，就是迭代器
class MyIterator:
    def __init__(self, max):
        self.max = max
        self.current = 0
    
    def __iter__(self):
        return self
    
    def __next__(self):
        if self.current >= self.max:
            raise StopIteration
        value = self.current
        self.current += 1
        return value

🎯 本讲总结

自定义序列：实现 __len__和__getitem__。

自动支持的操作：索引、切片、迭代、排序等。

鸭子类型：不关注类型，只关注行为。

学习路线： 零基础 → 《从入门到实践》 → 《流畅的 Python》 → 本门课程 → 《CPython 设计与实现》

🔗 课程导航

← 上一讲：对象引用与可变性 | 下一讲：继承与组合 →

💬 联系我

平台	账号/链接
微信	扫码加好友
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

展开全文 >>

第 9 讲：对象引用与可变性——避免难以调试的 Bug

2026-03-03

为什么修改了列表 A，列表 B 也跟着变了？理解引用和可变性，避免这类 bug！

🔗 引用与身份

共享引用

a = [1, 2, 3]
b = a  # b 引用同一个对象
b.append(4)
print(a)  # [1, 2, 3, 4] - a 也被修改了！

# 检查身份
print(a is b)  # True - 同一对象
print(id(a) == id(b))  # True

值相等 vs 身份相同

a = [1, 2, 3]
b = [1, 2, 3]

print(a == b)  # True - 值相等
print(a is b)  # False - 不同对象

📋 深浅拷贝

浅拷贝

import copy

original = [[1, 2], [3, 4]]
shallow = copy.copy(original)

shallow[0][0] = 'X'
print(original)  # [['X', 2], [3, 4]] - 内部对象被修改

深拷贝

import copy

original = [[1, 2], [3, 4]]
deep = copy.deepcopy(original)

deep[0][0] = 'Y'
print(original)  # [[1, 2], [3, 4]] - 不受影响

何时使用

场景	推荐	原因
简单对象	切片或构造	快速
嵌套对象	深拷贝	避免共享
只读访问	无需拷贝	节省内存

⚠️ 可变默认参数陷阱

# 错误示例
class BadExample:
    def __init__(self, items=[]):  # 危险！
        self.items = items

# 正确做法
class GoodExample:
    def __init__(self, items=None):
        self.items = items if items is not None else []

🎯 本讲总结

引用与身份：理解 is 和==的区别。

深浅拷贝：copy() vs deepcopy()。

可变默认参数：避免使用可变对象作为默认参数。

学习路线： 零基础 → 《从入门到实践》 → 《流畅的 Python》 → 本门课程 → 《CPython 设计与实现》

🔗 课程导航

← 上一讲：可调用对象 | 下一讲：序列和多态 →

💬 联系我

平台	账号/链接
微信	扫码加好友
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

展开全文 >>

第 8 讲：可调用对象——超越普通函数的设计模式

2026-03-03

让类的实例像函数一样被调用，实现更灵活的设计模式。

🎯 call方法

基础用法

class Counter:
    def __init__(self):
        self.count = 0
    
    def __call__(self):
        self.count += 1
        return self.count

# 使用
counter = Counter()
print(counter())  # 1
print(counter())  # 2
print(counter())  # 3

可调用对象的优势

相比普通函数，可调用对象可以：

保存状态（实例属性）
继承和组合
实现多个接口

🎨 策略模式实现

函数式策略

# 简单的策略
def regular_discount(price):
    return price * 0.9

def vip_discount(price):
    return price * 0.8

# 使用
strategies = {'regular': regular_discount, 'vip': vip_discount}
print(strategies['vip'](100))  # 80.0

类策略模式

from abc import ABC, abstractmethod

class DiscountStrategy(ABC):
    @abstractmethod
    def calculate(self, price):
        pass

class RegularDiscount(DiscountStrategy):
    def calculate(self, price):
        return price * 0.9

class VIPDiscount(DiscountStrategy):
    def calculate(self, price):
        return price * 0.8

class PriceCalculator:
    def __init__(self, strategy: DiscountStrategy):
        self.strategy = strategy
    
    def get_price(self, price):
        return self.strategy.calculate(price)

# 使用
calc = PriceCalculator(VIPDiscount())
print(calc.get_price(100))  # 80.0

🎯 本讲总结

__call__方法：让实例像函数一样调用。

可调用对象：可以保存状态、继承、组合。

策略模式：用函数或类实现可互换的算法。

学习路线： 零基础 → 《从入门到实践》 → 《流畅的 Python》 → 本门课程 → 《CPython 设计与实现》

🔗 课程导航

← 上一讲：生成器与协程 | 下一讲：对象引用与可变性 →

💬 联系我

平台	账号/链接
微信	扫码加好友
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

展开全文 >>

第 7 讲：生成器与协程——惰性求值与状态机的艺术

2026-03-03

处理 100 万条数据，内存只占用几 KB？生成器让这成为可能！

🔄 生成器函数

惰性求值

# 普通函数返回列表（占用大量内存）
def get_numbers(n):
    result = []
    for i in range(n):
        result.append(i ** 2)
    return result

# 生成器函数（惰性求值）
def get_numbers_gen(n):
    for i in range(n):
        yield i ** 2

# 使用
for num in get_numbers_gen(1000000):
    if num > 100:
        break  # 只计算需要的部分

yield 的工作原理

yield 让函数变成生成器。每次遇到 yield，函数：

返回一个值
暂停执行，保存当前状态
下次调用时从暂停处继续

📡 yield from

委托子生成器

def sub_generator():
    yield 1
    yield 2

def main_generator():
    yield 'A'
    yield from sub_generator()  # 委托
    yield 'B'

print(list(main_generator()))  # ['A', 1, 2, 'B']

实际应用场景

# 遍历嵌套结构
def flatten(nested):
    for item in nested:
        if isinstance(item, list):
            yield from flatten(item)
        else:
            yield item

print(list(flatten([1, [2, 3], [4, [5, 6]]])))
# [1, 2, 3, 4, 5, 6]

🎯 本讲总结

生成器函数：使用 yield 实现惰性求值。

yield from：委托子生成器，简化代码。

实际应用场景：大文件处理、管道处理、嵌套结构遍历。

学习路线： 零基础 → 《从入门到实践》 → 《流畅的 Python》 → 本门课程 → 《CPython 设计与实现》

🔗 课程导航

← 上一讲：装饰器详解 | 下一讲：可调用对象 →

💬 联系我

平台	账号/链接
微信	扫码加好友
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

展开全文 >>

第 6 讲：装饰器详解——优雅的代码增强与 AOP 编程

2026-03-03

装饰器是 Python 最优雅的特性之一，今天彻底掌握它！

🎨 基础装饰器

函数装饰器

import functools
import time

def timer(func):
    @functools.wraps(func)  # 保留原函数信息
    def wrapper(*args, **kwargs):
        start = time.time()
        result = func(*args, **kwargs)
        elapsed = time.time() - start
        print(f"{func.__name__} took {elapsed:.4f}s")
        return result
    return wrapper

@timer
def slow_function():
    time.sleep(1)
    return "Done"

slow_function()  # slow_function took 1.0012s

为什么要用 functools.wraps？

# 不用 wraps
def bad_decorator(func):
    def wrapper(*args, **kwargs):
        return func(*args, **kwargs)
    return wrapper

@bad_decorator
def my_func():
    """这是文档字符串"""
    pass

print(my_func.__name__)  # wrapper（错误！）
print(my_func.__doc__)   # None（错误！）

# 用 wraps
def good_decorator(func):
    @functools.wraps(func)
    def wrapper(*args, **kwargs):
        return func(*args, **kwargs)
    return wrapper

🔧 参数化装饰器

带参数的装饰器

def repeat(n):
    """重复执行 n 次"""
    def decorator(func):
        def wrapper(*args, **kwargs):
            for _ in range(n):
                result = func(*args, **kwargs)
            return result
        return wrapper
    return decorator

@repeat(3)
def greet():
    print("Hello!")

greet()  # 打印 3 次 Hello!

类装饰器

class CountCalls:
    def __init__(self, func):
        functools.update_wrapper(self, func)
        self.func = func
        self.num_calls = 0
    
    def __call__(self, *args, **kwargs):
        self.num_calls += 1
        print(f"Call {self.num_calls} of {self.func.__name__}")
        return self.func(*args, **kwargs)

@CountCalls
def say_hello():
    print("Hello!")

say_hello()  # Call 1 of say_hello
say_hello()  # Call 2 of say_hello

🎯 本讲总结

基础装饰器：函数装饰器的实现原理。

functools.wraps：保留原函数信息。

参数化装饰器：带参数的装饰器。

类装饰器：用类实现装饰器。

学习路线： 零基础 → 《从入门到实践》 → 《流畅的 Python》 → 本门课程 → 《CPython 设计与实现》

🔗 课程导航

← 上一讲：函数即对象 | 下一讲：生成器与协程 →

💬 联系我

平台	账号/链接
微信	扫码加好友
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

展开全文 >>

第 5 讲：函数即对象——一等公民的威力与闭包机制

2026-03-03

在 Python 中，函数是一等公民，这意味着什么？

🎯 函数作为对象

函数赋值

# 函数可以赋值给变量
def greet(name):
    return f"Hello, {name}"

say_hello = greet
print(say_hello("Alice"))  # Hello, Alice

函数存储在数据结构中

# 函数列表
funcs = [len, str.upper, str.lower]
for f in funcs:
    print(f("Hello"))

# 函数字典
operations = {
    'add': lambda x, y: x + y,
    'mul': lambda x, y: x * y,
}
print(operations['add'](3, 4))  # 7

高阶函数

# 函数作为参数
def apply_func(func, value):
    return func(value)

result = apply_func(len, "Hello")  # 5

# 函数作为返回值
def make_multiplier(n):
    def multiplier(x):
        return x * n
    return multiplier

double = make_multiplier(2)
print(double(5))  # 10

🔒 闭包

闭包原理

# 闭包：函数记住其定义时的环境
def make_multiplier(n):
    def multiplier(x):
        return x * n  # 记住了 n 的值
    return multiplier

double = make_multiplier(2)
triple = make_multiplier(3)

print(double(5))  # 10
print(triple(5))  # 15

实际应用

# 装饰器的基础
def logger(prefix):
    def log(func):
        def wrapper(*args, **kwargs):
            print(f"[{prefix}] {func.__name__} called")
            return func(*args, **kwargs)
        return wrapper
    return log

@logger("INFO")
def say_hello(name):
    print(f"Hello, {name}")

🎯 本讲总结

函数即对象：可以赋值、存储、传递。

高阶函数：接受函数或返回函数的函数。

闭包：函数记住定义时的环境。

学习路线： 零基础 → 《从入门到实践》 → 《流畅的 Python》 → 本门课程 → 《CPython 设计与实现》

🔗 课程导航

← 上一讲：文本与字节 | 下一讲：装饰器详解 →

💬 联系我

平台	账号/链接
微信	扫码加好友
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

展开全文 >>

第 4 讲：文本与字节——Unicode 编码与字符串处理的艺术

2026-03-03

编码错误是 Python 程序员的噩梦，今天彻底搞懂它！

🔤 Unicode 与字节

字符串 vs 字节

# 字符串（Unicode）
s = 'Hello 中文'

# 字节序列
b = s.encode('utf-8')

# 解码回字符串
s2 = b.decode('utf-8')

常见编码问题

# 错误处理
try:
    text = some_bytes.decode('utf-8')
except UnicodeDecodeError:
    # 使用替换或忽略
    text = some_bytes.decode('gbk', errors='replace')

编码选择

编码	适用场景
UTF-8	通用，兼容 ASCII
GBK	中文环境
Latin-1	西欧语言

📝 正则表达式进阶

编译正则

import re

# 编译正则（提升性能）
pattern = re.compile(r'\d{3}-\d{4}-\d{4}')
matches = pattern.findall(text)

分组提取

# 提取日期
match = re.search(r'(\d{4})-(\d{2})-(\d{2})', date_string)
if match:
    year, month, day = match.groups()

常用模式

模式	含义
\d	数字
\w	字母数字下划线
\s	空白字符
.	任意字符
*	0 次或多次
+	1 次或多次
?	0 次或 1 次

🎯 本讲总结

Unicode：字符串与字节的转换。

编码处理：常见编码问题的解决方案。

正则表达式：编译、分组、常用模式。

学习路线： 零基础 → 《从入门到实践》 → 《流畅的 Python》 → 本门课程 → 《CPython 设计与实现》

🔗 课程导航

← 上一讲：集合与映射 | 下一讲：函数即对象 →

💬 联系我

平台	账号/链接
微信	扫码加好友
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

展开全文 >>

第 3 讲：集合与映射——高效数据处理的利器

2026-03-03

去重、交集、并集，用 set 一行代码搞定！

🔥 set 的高效操作

基础运算

# 快速去重
items = [1, 2, 2, 3, 3, 3]
unique = list(set(items))  # [1, 2, 3]

# 集合运算
a = {1, 2, 3}
b = {2, 3, 4}

print(a & b)  # 交集：{2, 3}
print(a | b)  # 并集：{1, 2, 3, 4}
print(a - b)  # 差集：{1}
print(a ^ b)  # 对称差集：{1, 4}

使用场景

场景	推荐	原因
去重	set	O(1) 时间复杂度
成员检查	set	O(1) vs list 的 O(n)
集合运算	set	内置支持
保持顺序	dict.fromkeys()	set 无序

📊 高级字典类型

defaultdict

from collections import defaultdict

# 自动初始化
counts = defaultdict(int)
for word in ['apple', 'banana', 'apple']:
    counts[word] += 1  # 不需要检查 key 是否存在

# 嵌套字典
tree = lambda: defaultdict(tree)
users = tree()
users['harold']['username'] = 'bell'

Counter

from collections import Counter

# 计数
words = ['apple', 'banana', 'apple', 'cherry', 'apple']
word_counts = Counter(words)

print(word_counts.most_common(2))  # [('apple', 3), ('banana', 1)]

# 集合运算
c1 = Counter(['a', 'b', 'c'])
c2 = Counter(['b', 'c', 'd'])
print(c1 & c2)  # Counter({'b': 1, 'c': 1})

OrderedDict

from collections import OrderedDict

# 保持插入顺序（Python 3.7+ 普通 dict 也保持顺序）
od = OrderedDict()
od['a'] = 1
od['b'] = 2
od['c'] = 3

# 移动到最后
od.move_to_end('a')

🎯 本讲总结

set 操作：去重、交集、并集、差集。

defaultdict：自动初始化的字典。

Counter：强大的计数工具。

学习路线： 零基础 → 《从入门到实践》 → 《流畅的 Python》 → 本门课程 → 《CPython 设计与实现》

🔗 课程导航

← 上一讲：数据容器深度解析 | 下一讲：文本与字节 →

💬 联系我

平台	账号/链接
微信	扫码加好友
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

展开全文 >>

第 2 讲：数据容器深度解析——列表推导式与生成器表达式

2026-03-03

同样的数据处理，为什么别人的代码更快更省内存？

秘密就在列表推导式和生成器表达式。

🚀 列表推导式

基础用法

# 传统循环
squares = []
for x in range(10):
    squares.append(x**2)

# 列表推导式（更快更简洁）
squares = [x**2 for x in range(10)]

# 带条件筛选
evens = [x for x in range(10) if x % 2 == 0]

# 多重循环
combinations = [(x, y) for x in 'ABC' for y in '123']

性能对比

列表推导式比传统循环快 1.5-2 倍，因为：

避免了反复调用 append 方法
内部使用优化的 C 代码
减少了字节码指令数量

import timeit

# 列表推导式
list_comp_time = timeit.timeit('[x**2 for x in range(1000)]', number=1000)

# 普通循环
loop_time = timeit.timeit('''
result = []
for x in range(1000):
    result.append(x**2)
''', number=1000)

print(f"列表推导式：{list_comp_time:.4f}s")
print(f"普通循环：{loop_time:.4f}s")

💡 生成器表达式

惰性求值

# 列表推导式（占用内存）
large_list = [x**2 for x in range(1000000)]  # 约 8MB

# 生成器表达式（惰性求值）
large_gen = (x**2 for x in range(1000000))   # 几乎不占用内存

# 使用时才计算
for val in large_gen:
    if val > 100:
        break

使用场景

场景	推荐	原因
需要多次遍历	列表推导式	生成器只能遍历一次
数据量大	生成器表达式	节省内存
需要索引访问	列表推导式	生成器不支持索引
管道处理	生成器表达式	惰性求值更适合

📊 字典技巧

字典推导式

# 创建字典
word_lengths = {word: len(word) for word in ['apple', 'banana', 'cherry']}

# 过滤
even_lengths = {word: length for word, length in word_lengths.items() if length % 2 == 0}

合并字典（Python 3.9+）

dict1 = {'a': 1, 'b': 2}
dict2 = {'c': 3, 'd': 4}

# Python 3.9+
merged = dict1 | dict2

# 旧版本
merged = {**dict1, **dict2}

setdefault 技巧

# 统计词频
counts = {}
for word in words:
    counts.setdefault(word, 0)
    counts[word] += 1

# 更优雅的方式
from collections import Counter
counts = Counter(words)

🎯 本讲总结

列表推导式：更快更简洁的数据处理方式。

生成器表达式：惰性求值，节省内存。

字典技巧：推导式、合并、setdefault 等实用技巧。

学习路线： 零基础 → 《从入门到实践》 → 《流畅的 Python》 → 本门课程 → 《CPython 设计与实现》

🔗 课程导航

← 上一讲：Python 数据模型 | 下一讲：集合与映射 →

💬 联系我

平台	账号/链接
微信	扫码加好友
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

展开全文 >>

第 1 讲：Python 数据模型——特殊方法与协议设计

2026-03-03

为什么同样的功能，别人写的代码更优雅？

答案：Python 数据模型。掌握它，让你的类像内置类型一样好用。

想象一下，你设计了一个向量类 Vector。你希望它能像数字一样相加、相乘，能打印出友好的字符串表示，能用 len() 获取维度。这些功能不是 Python 自动给你的，而是通过实现特殊方法（也叫魔术方法）来实现的。

🎯 什么是 Python 数据模型？

核心思想

Python 的数据模型是一套协议和约定，它定义了对象如何与 Python 的其他部分交互。通过实现特定的特殊方法，你的对象可以：

像数字一样运算（+、-、*、/）
像序列一样索引和切片（[]）
像函数一样调用（()）
像上下文管理器一样使用（with）
像迭代器一样遍历（for）

# 普通写法
if len(my_list) > 0:
    first = my_list[0]

# Pythonic 写法
if my_list:  # 调用__bool__
    first = my_list[0]  # 调用__getitem__

特殊方法的命名

特殊方法都用双下划线开头和结尾，比如：

方法	作用	触发场景
init	初始化	创建对象时
repr	官方字符串表示	repr()、交互式解释器
str	用户友好字符串	str()、print()
len	长度	len()
getitem	获取元素	obj[key]
setitem	设置元素	obj[key] = value
add	加法	a + b
call	调用	obj()

🔑 关键协议

序列协议

实现序列协议，让你的对象像列表一样工作：

class Deck:
    """一副扑克牌"""
    ranks = [str(n) for n in range(2, 11)] + list('JQKA')
    suits = '♠♥♦♣'
    
    def __init__(self):
        self._cards = [
            (rank, suit) for suit in self.suits
            for rank in self.ranks
        ]
    
    def __len__(self):
        return len(self._cards)
    
    def __getitem__(self, position):
        return self._cards[position]

# 使用
deck = Deck()
print(len(deck))      # 52
print(deck[0])        # ('2', '♠')
print(deck[:5])       # 切片支持
for card in deck:     # 迭代支持
    print(card)

只实现两个方法，Deck 就支持了：

len() 函数
索引访问
切片操作
for 循环遍历
in 运算符

数值协议

实现数值协议，让你的对象像数字一样运算：

class Vector:
    def __init__(self, x, y):
        self.x = x
        self.y = y
    
    def __repr__(self):
        return f'Vector({self.x}, {self.y})'
    
    def __add__(self, other):
        return Vector(self.x + other.x, self.y + other.y)
    
    def __mul__(self, scalar):
        return Vector(self.x * scalar, self.y * scalar)
    
    def __abs__(self):
        return (self.x ** 2 + self.y ** 2) ** 0.5

# 使用
v1 = Vector(3, 4)
v2 = Vector(1, 2)
print(v1 + v2)  # Vector(4, 6)
print(abs(v1))  # 5.0
print(v1 * 3)   # Vector(9, 12)

上下文管理协议

实现上下文管理协议，让你的对象支持 with 语句：

class FileManager:
    def __init__(self, filename):
        self.filename = filename
    
    def __enter__(self):
        self.file = open(self.filename, 'r')
        return self.file
    
    def __exit__(self, exc_type, exc_val, exc_tb):
        self.file.close()

# 使用
with FileManager('test.txt') as f:
    content = f.read()
# 自动关闭文件

💡 实战技巧

1. repr vs str

class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age
    
    def __repr__(self):
        # 官方表示，用于调试
        return f"Person('{self.name}', {self.age})"
    
    def __str__(self):
        # 用户友好表示，用于打印
        return f"{self.name} ({self.age}岁)"

p = Person("张三", 30)
print(repr(p))  # Person('张三', 30)
print(str(p))   # 张三 (30 岁)
print(p)        # 张三 (30 岁) - print 调用__str__

2. 让类支持迭代

class MyRange:
    def __init__(self, start, end):
        self.start = start
        self.end = end
    
    def __iter__(self):
        self.current = self.start
        return self
    
    def __next__(self):
        if self.current >= self.end:
            raise StopIteration
        value = self.current
        self.current += 1
        return value

# 使用
for i in MyRange(1, 5):
    print(i)  # 1, 2, 3, 4

3. 鸭子类型

# 不关注类型，只关注行为
def print_length(obj):
    print(len(obj))  # 任何有__len__的对象都可以

print_length([1, 2, 3])      # 3
print_length("hello")        # 5
print_length({'a': 1, 'b': 2})  # 2

⚠️ 常见陷阱

1. 可变默认参数

# 错误示例
class BadExample:
    def __init__(self, items=[]):  # 危险！
        self.items = items

# 正确做法
class GoodExample:
    def __init__(self, items=None):
        self.items = items if items is not None else []

2. 忘记调用父类方法

# 错误示例
class Child(Parent):
    def __init__(self, value):
        self.value = value
        # 忘记调用 super().__init__()

# 正确做法
class Child(Parent):
    def __init__(self, value):
        super().__init__()
        self.value = value

🎯 本讲总结

通过本讲，我们理解了：

数据模型：Python 对象交互的协议和约定。

特殊方法：让自定义对象像内置类型一样工作。

关键协议：序列协议、数值协议、上下文管理协议等。

实战技巧：repr vs __str__、迭代器实现、鸭子类型。

常见陷阱：可变默认参数、忘记调用父类方法。

📚 推荐教材

《Python 编程从入门到实践（第 3 版）》 - Eric Matthes 著

Python 零基础入门首选。本书分为基础语法和项目实战两部分，适合完全没有编程经验的读者。

《流畅的 Python（第 2 版）》 - Luciano Ramalho 著

Python 进阶经典之作。深入讲解 Python 的高级特性，包括数据模型、函数式编程、面向对象、元编程等。

《CPython 设计与实现》 - Anthony Shaw 著

本书深入讲解 CPython 内部机制，从内存管理到字节码执行，从对象模型到并发编程。配合本课程学习，效果更佳。

学习路线建议：

1	零基础 → 《从入门到实践》 → 《流畅的 Python》 → 本门课程 → 《CPython 设计与实现》

🔗 课程导航

← 课程大纲 | 下一讲：数据容器深度解析 →

💬 联系我

平台	账号/链接
微信	扫码加好友
微博	@程序员晚枫
知乎	@程序员晚枫
抖音	@程序员晚枫
小红书	@程序员晚枫
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

展开全文 >>

《流畅的 Python》20 讲 · 高阶编程实战课程大纲

2026-03-03

《流畅的 Python》20 讲 · 高阶编程实战课程

📚 课程介绍

《流畅的 Python》是 Python 进阶领域的经典著作，由 Luciano Ramalho 撰写。本课程基于该书第 2 版，结合 Python 3.10+ 新特性，带你深入理解 Python 的设计哲学和高级特性。

适合人群：

有 1-3 年 Python 使用经验的开发者
想从”会用 Python”进阶到”精通 Python”
想写出更 Pythonic、更优雅代码的程序员
准备面试高级 Python 岗位的求职者

学完你将掌握：

深入理解 Python 数据模型和对象系统
掌握函数式编程和面向对象的高级用法
熟练运用元编程、描述符、装饰器等高级特性
理解并发编程模型和异步编程
写出性能更优、更易维护的代码

📖 课程目录（20 讲）

第一部分：Python 基础与数据模型（第 1-4 讲）

第 1 讲：Python 数据模型 - 一切皆对象

特殊方法（魔术方法）的作用
实现序列和可迭代对象
不可变对象 vs 可变对象

第 2 讲：数据容器 - 列表、元组、字典的深度使用

列表推导式的高级用法
元组的拆包和命名元组
字典的内存优化和性能分析

第 3 讲：集合与映射 - 高效数据处理

set 和 frozenset 的实际应用
defaultdict、OrderedDict、Counter 的妙用
映射视图和集合操作

第 4 讲：文本与字节 - 字符串处理的艺术

Unicode 编码详解
字节序列和内存视图
正则表达式的高级技巧

第二部分：函数式编程（第 5-8 讲）

第 5 讲：函数即对象 - 一等公民的威力

高阶函数的实际应用
柯里化和偏函数
自由变量和闭包

第 6 讲：装饰器 - 优雅的代码增强

函数装饰器的实现原理
参数化装饰器
类装饰器和装饰器类

第 7 讲：生成器与协程 - 惰性求值的力量

生成器函数的进阶用法
yield from 语法
协程的概念和实际应用

第 8 讲：可调用对象 - 超越普通函数

实现__call__方法
策略模式与函数对象
命令模式实战

第三部分：面向对象编程（第 9-13 讲）

第 9 讲：对象引用与可变性

可变对象的陷阱
防御性编程技巧
不可变数据结构的设计

第 10 讲：序列和多态

实现自定义序列类型
切片操作的原理
多态与鸭子类型

第 11 讲：继承与组合 - 代码复用的艺术

多重继承和 MRO
mixins 模式
组合优于继承的实战

第 12 讲：接口与协议 - Python 式的抽象

抽象基类（ABC）的使用
协议（Protocol）类型提示
结构子类型化

第 13 讲：描述符 - 属性访问的魔法

描述符协议详解
验证描述符的实现
描述符与属性的交互

第四部分：元编程（第 14-16 讲）

第 14 讲：动态属性和特性

getattr__和__getattribute
__slots__的内存优化
动态属性验证

第 15 讲：类元编程 - 元类详解

元类的工作原理
实现自定义元类
元类的实际应用场景

第 16 讲：运行时类型检查与类型提示

typing 模块深度使用
泛型和类型变量
静态类型检查工具

第五部分：并发与性能（第 17-20 讲）

第 17 讲：并发编程模型

线程与进程的选择
GIL 的影响和应对
线程安全的数据结构

第 18 讲：异步编程 - asyncio 实战

async/await 语法详解
asyncio 事件循环
异步 IO 实际应用

第 19 讲：性能优化技巧

性能分析工具（cProfile、line_profiler）
内存优化策略
使用 C 扩展加速

第 20 讲：最佳实践与代码规范

PEP 8 进阶指南
代码重构技巧
大型项目的组织方式

🎁 配套资源

每讲包含：

✅ 详细文字教程（本仓库文章）
✅ 完整代码示例（GitHub 仓库）
✅ 实战练习题
✅ 常见问题解答

代码仓库：

GitHub: https://github.com/CoderWanFeng/fluent-python-course
Gitee: https://gitee.com/CoderWanFeng/fluent-python-course
AtomGit: https://atomgit.com/CoderWanFeng/fluent-python-course

💬 学习社区

加入我们的学习交流群，一起讨论、一起进步：

微信：python-office（备注：流畅 Python）

📅 更新计划

2026 年 3 月：发布第 1-5 讲
2026 年 4 月：发布第 6-10 讲
2026 年 5 月：发布第 11-15 讲
2026 年 6 月：发布第 16-20 讲

🔗 相关课程

本课程与以下课程形成完整体系：

Python 入门课：适合零基础学员
Python 自动化办公：专注办公场景
Python 数据分析：数据科学方向
Python 高级课：已发布的进阶内容

这套《流畅的 Python》课程将更深入地讲解 Python 语言特性和设计哲学。

程序员晚枫 专注 AI 编程培训，带你从入门到精通。

📚 推荐图书

购买正版：《流畅的 Python（第 2 版）》

💬 联系我

平台	账号/链接
微信	扫码加好友
微博	@程序员晚枫
知乎	@程序员晚枫
抖音	@程序员晚枫
小红书	@程序员晚枫
B 站	Python 自动化办公社区

主营业务：AI 编程培训、企业内训、技术咨询

展开全文 >>

第 12 讲：毕业项目与变现 - 从学习到赚钱

2026-03-02

more >>

展开全文 >>

🎯 元类基础

type 是元类

自定义元类

🔧 new__和__init

自动注册模式

🎯 本讲总结

📚 推荐教材

🔗 课程导航

💬 联系我

🏗️ CPython 整体架构：从源代码到执行结果

解释器的工作流程

各组件的职责详解

📁 源码目录结构：一座精心设计的城市

核心区域详解

为什么这样组织？

🔧 从源码编译：亲手打造你的 Python

为什么需要调试版本？

编译过程的本质

常见问题与解决

🐛 调试环境搭建：与源码”对话”

GDB 基础使用

调试实战：追踪一个整数对象

💡 第一个源码实验：小整数缓存机制

现象观察

原理解析

源码验证

🎯 本讲总结

📚 推荐教材

🔗 课程导航

💬 联系我

🎯 getattr__和__getattribute

延迟加载

区别

💾 __slots__内存优化

使用示例

何时使用slots

🎯 本讲总结

📚 推荐教材

🔗 课程导航

💬 联系我

CPython 设计与实现 - 20 讲 Python 解释器底层原理实战课

📚 课程简介

📖 课程目录（20 讲）

第一部分：CPython 基础（第 1-4 讲）

第二部分：编译与执行（第 5-9 讲）

第三部分：核心对象实现（第 10-13 讲）

第四部分：运行时系统（第 14-17 讲）

第五部分：高级主题（第 18-20 讲）

📚 推荐教材

💬 联系我

📅 更新计划

🎯 描述符协议

验证描述符

描述符协议

🎯 本讲总结

📚 推荐教材

🔗 课程导航

💬 联系我

🎯 抽象基类 ABC

基础用法

何时使用 ABC

📋 Protocol 类型提示

结构子类型

Protocol vs ABC

🎯 本讲总结

📚 推荐教材

🔗 课程导航

💬 联系我

🧬 MRO 方法解析顺序

多重继承

查看 MRO

🔧 Mixin 模式

什么是 Mixin？

实现示例

⚖️ 继承 vs 组合

何时使用继承

何时使用组合

🎯 本讲总结

📚 推荐教材

🔗 课程导航

🔧 new和init

🎯 getattr和getattribute

💾 slots内存优化

🎯 call方法