PyTorch · 完整白皮书 | 编程语言全景手册

📌 第一部分：PyTorch 概览与定位

1.1 定义与全称

PyTorch 是由 Meta（Facebook）的人工智能研究团队于 2016 年开源的深度学习框架，基于 Torch 库和 Python 语言构建。PyTorch 以 动态计算图（Define-by-Run） 为核心特性，被誉为"学术界最受欢迎的深度学习框架"。

1.2 核心定位

PyTorch 的核心定位是 研究与生产一体化的深度学习框架。它提供了：

动态计算图（执行时构建）
张量计算（类似 NumPy）
自动微分（Autograd）
GPU 加速（CUDA）
丰富的预训练模型库
TorchScript（生产部署）
分布式训练支持
ONNX 导出
与 Python 生态无缝集成

1.3 主要应用领域

自然语言处理： 文本分类、机器翻译、对话系统
计算机视觉： 图像分类、目标检测、分割
语音识别： 语音转文字、语音合成
强化学习： 游戏 AI、机器人控制
生成式 AI： 大语言模型、图像生成
科研实验： 快速原型验证

1.4 知名案例

OpenAI： 使用 PyTorch 训练 GPT
Google DeepMind： 部分研究使用 PyTorch
Microsoft： 使用 PyTorch 进行 AI 研究
Tesla： 使用 PyTorch 进行自动驾驶
国内： 阿里巴巴、腾讯、字节跳动

📜 第二部分：PyTorch 的历史与发展演进

2.1 诞生背景（2016年）

PyTorch 由 Meta 的 AI 研究团队于 2016 年开源，基于 Torch（Lua）的 Python 实现。其动态计算图特性吸引了大量研究者，迅速成为学术界的首选框架。

2.2 关键版本里程碑

PyTorch 0.1（2016年）： 首次开源
PyTorch 0.4（2018年）： 支持 Windows
PyTorch 1.0（2018年）： 生产级稳定——TorchScript、JIT
PyTorch 1.5（2020年）： C++ 前端
PyTorch 1.7（2020年）： 分布式训练增强
PyTorch 1.10（2021年）： 性能优化
PyTorch 1.12（2022年）： 编译加速
PyTorch 2.0（2023年）： 重大升级——TorchInductor 编译器
PyTorch 2.1（2023年）： 性能提升
PyTorch 2.3（2024年）： 最新版本

⚙️ 第三部分：核心语法与操作

3.1 张量基础

import torch
import numpy as np

# 张量创建
x = torch.tensor([1, 2, 3, 4, 5])
y = torch.tensor([[1, 2], [3, 4]])
z = torch.zeros(3, 4)
w = torch.ones(2, 3)
r = torch.randn(3, 3)  # 正态分布随机

# 张量属性
print(x.shape)           # torch.Size([5])
print(x.dtype)           # torch.int64
print(x.device)          # cpu

# NumPy 互转
arr = np.array([1, 2, 3])
tensor = torch.from_numpy(arr)
back_to_numpy = tensor.numpy()

# GPU 移动
if torch.cuda.is_available():
    x_gpu = x.cuda()
    y_cpu = x_gpu.cpu()

# 张量运算
a = torch.tensor([1, 2, 3])
b = torch.tensor([4, 5, 6])
c = a + b
d = a * b
e = torch.matmul(a, b)
f = torch.sum(a)

3.2 自动微分（Autograd）

# 自动微分示例
x = torch.tensor(2.0, requires_grad=True)
y = x ** 2 + 3 * x + 1

# 反向传播
y.backward()

# 梯度
print(x.grad)  # 2*2 + 3 = 7

# 复杂计算图
x = torch.randn(3, 3, requires_grad=True)
y = x ** 2
z = y.mean()

z.backward()
print(x.grad)  # 2x/9

3.3 神经网络构建

import torch.nn as nn
import torch.nn.functional as F

# 简单神经网络
class SimpleNN(nn.Module):
    def __init__(self, input_size, hidden_size, output_size):
        super(SimpleNN, self).__init__()
        self.fc1 = nn.Linear(input_size, hidden_size)
        self.fc2 = nn.Linear(hidden_size, output_size)

    def forward(self, x):
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return x

# 卷积神经网络（CNN）
class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()
        self.conv1 = nn.Conv2d(1, 32, kernel_size=3, padding=1)
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3, padding=1)
        self.fc1 = nn.Linear(64 * 7 * 7, 128)
        self.fc2 = nn.Linear(128, 10)
        self.pool = nn.MaxPool2d(2, 2)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 64 * 7 * 7)
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return x

# LSTM 网络
class LSTM(nn.Module):
    def __init__(self, input_size, hidden_size, num_layers, output_size):
        super(LSTM, self).__init__()
        self.lstm = nn.LSTM(input_size, hidden_size, num_layers, batch_first=True)
        self.fc = nn.Linear(hidden_size, output_size)

    def forward(self, x):
        out, _ = self.lstm(x)
        out = out[:, -1, :]  # 取最后一个时间步
        out = self.fc(out)
        return out

3.4 训练循环

import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset

# 准备数据
X = torch.randn(1000, 10)
y = torch.randint(0, 2, (1000,))
dataset = TensorDataset(X, y)
dataloader = DataLoader(dataset, batch_size=32, shuffle=True)

# 模型、损失函数、优化器
model = SimpleNN(10, 64, 2)
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 训练循环
num_epochs = 10
for epoch in range(num_epochs):
    running_loss = 0.0
    for batch_X, batch_y in dataloader:
        # 前向传播
        outputs = model(batch_X)
        loss = criterion(outputs, batch_y)

        # 反向传播
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        running_loss += loss.item()

    print(f"Epoch {epoch+1}, Loss: {running_loss/len(dataloader):.4f}")

# 评估
model.eval()
with torch.no_grad():
    test_X = torch.randn(100, 10)
    test_y = torch.randint(0, 2, (100,))
    outputs = model(test_X)
    _, predicted = torch.max(outputs, 1)
    accuracy = (predicted == test_y).float().mean()
    print(f"Accuracy: {accuracy:.4f}")

3.5 迁移学习

import torchvision.models as models
import torchvision.transforms as transforms

# 加载预训练模型
resnet = models.resnet18(pretrained=True)

# 冻结所有层
for param in resnet.parameters():
    param.requires_grad = False

# 替换最后一层
num_features = resnet.fc.in_features
resnet.fc = nn.Linear(num_features, 10)  # 10 个类别

# 定义数据增强
transform = transforms.Compose([
    transforms.Resize(256),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406],
                         std=[0.229, 0.224, 0.225])
])

# 训练（只训练最后一层）
optimizer = optim.Adam(resnet.fc.parameters(), lr=0.001)
criterion = nn.CrossEntropyLoss()

# ... 训练循环

3.6 分布式训练

import torch.distributed as dist
from torch.nn.parallel import DistributedDataParallel as DDP

# 初始化进程组
dist.init_process_group("nccl")
local_rank = int(os.environ["LOCAL_RANK"])

# 创建模型并移动到 GPU
model = SimpleNN(10, 64, 2).cuda(local_rank)
model = DDP(model, device_ids=[local_rank])

# 分布式数据加载
train_sampler = DistributedSampler(train_dataset)
train_loader = DataLoader(train_dataset,
    batch_size=32,
    sampler=train_sampler,
    num_workers=4)

# 训练
for epoch in range(num_epochs):
    train_sampler.set_epoch(epoch)
    for batch in train_loader:
        # ... 训练代码

3.7 模型保存与加载

# 保存模型
torch.save(model.state_dict(), "model.pth")

# 加载模型
model = SimpleNN(10, 64, 2)
model.load_state_dict(torch.load("model.pth"))
model.eval()

# 保存完整模型（包含架构）
torch.save(model, "model_full.pth")
model = torch.load("model_full.pth")

# 导出为 ONNX
dummy_input = torch.randn(1, 10)
torch.onnx.export(model, dummy_input, "model.onnx")

# 使用 TorchScript 导出
scripted_model = torch.jit.script(model)
scripted_model.save("model.pt")

3.8 与 TensorBoard 集成

from torch.utils.tensorboard import SummaryWriter

writer = SummaryWriter("logs")

# 记录损失
writer.add_scalar("Loss/train", loss, epoch)

# 记录准确率
writer.add_scalar("Accuracy/train", accuracy, epoch)

# 记录模型结构
writer.add_graph(model, dummy_input)

# 记录图像
writer.add_image("images", batch_images, epoch)

# 记录超参数
writer.add_hparams({"lr": 0.001, "batch_size": 32}, {"accuracy": 0.95})

writer.close()

⚖️ 第四部分：PyTorch vs TensorFlow vs JAX

对比项	PyTorch	TensorFlow	JAX
计算图	动态	静态/动态	动态
学习曲线	平缓	中等	陡峭
学术界	最流行	流行	增长中
生产部署	✅ TorchScript	✅ 完善	❌ 有限
生态	丰富	极丰富	增长中

🧠 第五部分：学习建议

前置知识

Python、NumPy、机器学习基础

基础入门

张量操作、自动微分、简单神经网络

核心进阶

CNN、RNN、LSTM、迁移学习

高级方向

分布式训练、模型部署、Transformer、大模型微调

🎯 总结升华

PyTorch 是深度学习研究的"首选工具"。

它用 动态计算图、Pythonic 风格、强大的 GPU 支持 让深度学习研究和开发变得高效而愉悦。PyTorch 是学术界和工业界都喜爱的框架。

"PyTorch 让深度学习变得像写 Python 一样自然。" 🔥

🔖 相关标签

📄 本文档为 PyTorch 完整白皮书 · 最后更新于 2026年06月28日

📑 本文目录