🦀 crossbeam-deque 内幕：工作窃取引擎设计与高性能调度器从零构建

Photos provided by Unsplash OR Pexels

🦀 crossbeam-deque 工作窃取实现深度剖析：从底层设计到生产级任务调度器完整构建（2026 最新视角）

crossbeam-deque 是 Rust 并发生态中最经典的工作窃取（work-stealing）双端队列实现之一。它是 Rayon 内部调度器的核心引擎（Rayon 完全依赖它实现任务窃取），同时也被许多高性能任务调度器直接使用（如自定义线程池、游戏引擎任务系统、分布式计算等）。

本文基于 crossbeam-deque 0.8.x 主干源码（2024–2026 稳定版）+ 官方文档 + 社区典型用法，由浅入深拆解其工作窃取机制的核心原理、API 设计、窃取策略、内存模型，以及如何在实际项目中（例如 LogCleaner 并行压缩、自定义任务调度器）落地。

1. 经典工作窃取模型回顾（为什么需要 deque）

传统线程池 + 全局队列的问题：

所有线程抢一个 Mutex → 严重锁竞争
缓存行伪共享（false sharing）
任务分布不均 → 部分线程空转，部分线程过载

工作窃取解决方案（Chase–Lev 算法变种）：

每个线程拥有私有双端队列（LIFO 或 FIFO）
线程优先从自己队列头部 pop（局部性最好，无锁）
自己队列空了 → 尝试从全局 injector 批量偷取（steal_batch）
还是空 → 随机/轮询其他线程的队列，从尾部 steal（只偷一个或批量）
偷取操作是无锁的，依赖原子操作 + 内存序

crossbeam-deque 实现了这个模型的高性能、无锁版本，使用了Chase–Lev deque 的优化变体（带缓冲区增长、批量窃取等）。

2. 核心三元组：Injector + Worker + Stealer

use crossbeam_deque::{Injector, Worker, Stealer};

组件	所有者	操作方向	并发性	典型语义
Injector	全局（共享）	push / steal_batch	多线程 push，多线程 steal	任务注入点（主线程或分发器）
Worker	每个线程独占	push / pop	单线程（无锁）	本地任务队列
Stealer	从 Worker 生成，可共享	steal / steal_batch	多线程只读 steal	被其他线程窃取的句柄

关键设计原则：

Worker 是线程本地的，不需要 Arc 或 Mutex
Stealer 是 Worker 的只读视图，可以 Clone + Send + Sync，安全共享给其他线程
窃取总是从队列尾部（与 push/pop 的头部相反），保证 LIFO 局部性 + 减少冲突

3. 窃取操作的三种味道（源码核心）

源码中 Stealer 提供了三种 steal 方法（最关键的部分）：

pub enum Steal<T> {
    Empty,    // 目标队列为空
    Retry,    // 瞬时冲突，需要重试（ABA 或竞争）
    Success(T), // 成功偷到一个任务
}

方法	行为	适用场景	冲突重试策略
`steal()`	偷一个任务	轻负载、快速尝试	立即重试
`steal_batch(dest: &Worker<T>)`	偷一批（数量未指定，通常 1/2~任务）到目标 Worker	批量迁移负载	重试多次
`steal_batch_and_pop(dest: &Worker<T>)`	偷一批 + 立即 pop 一个返回	最常用（偷来就执行）	重试多次

源码实现要点（简化伪码，真实代码更复杂，涉及缓冲区、索引、内存屏障）：

// 极简 Chase–Lev deque 核心逻辑（非真实源码）
struct Deque {
    buffer: AtomicPtr<Buffer<T>>,
    top: AtomicUsize,    // 头部（pop/push 位置）
    bottom: AtomicUsize, // 尾部（steal 位置）
}

fn pop(&self) -> Option<T> { /* CAS top */ }
fn push(&self, task: T) { /* CAS bottom */ }
fn steal(&self) -> Steal<T> {
    loop {
        let b = self.bottom.load(Relaxed);
        let t = self.top.load(Acquire);
        if b <= t { return Steal::Empty; }
        // 尝试 CAS top → t+1
        if self.top.compare_exchange(t, t+1, AcqRel, Relaxed).is_ok() {
            return Steal::Success(/* 读取任务 */);
        }
        // 失败 → Retry
    }
}

使用双索引（top/bottom） + CAS 实现无锁
缓冲区动态增长（当 bottom 追上 top 时扩容 2x）
steal_batch 通常偷走一半任务（启发式），减少频繁 steal

4. 典型生产级任务查找循环（官方示例精炼）

fn find_task<T>(
    local: &Worker<T>,
    global: &Injector<T>,
    stealers: &[Stealer<T>],
) -> Option<T> {
    // 优先本地 pop（最快，无竞争）
    local.pop().or_else(|| {
        // 尝试从全局批量偷 + 立即执行一个
        global.steal_batch_and_pop(local)
    }).or_else(|| {
        // 轮询/随机其他线程偷一个（可 shuffle stealers 防热点）
        stealers.iter()
            .map(|s| s.steal())
            .collect::<Steal<T>>()
            // Steal::from_iter 实现：优先 Success，其次 Retry，最后 Empty
    }).success()
}

注意：Steal 的 FromIterator 实现非常巧妙：

只要有一个 Success 就立即返回它
只要有一个 Retry 就标记需要重试
全 Empty 才返回 Empty

这保证了优先级：本地 > 全局批量 > 其他线程单个

5. 在 LogCleaner 并行压缩中的落地示例（改进版）

假设我们用 crossbeam-deque 替换之前的 channel 方案，实现真正的工作窃取压缩池：

use crossbeam_deque::{Injector, Worker, Stealer};
use crossbeam_utils::thread::scope;

fn parallel_compress(files: &[FileInfo], level: i32, dry_run: bool) {
    let injector = Injector::new();
    for f in files.iter().cloned() {
        injector.push(f);
    }

    let stealers: Vec<Stealer<FileInfo>> = scope(|s| {
        let mut stealers = vec![];

        for _ in 0..num_cpus::get().min(8) {
            let worker = Worker::new_fifo(); // 或 new_lifo，根据语义选
            stealers.push(worker.stealer());

            let injector = &injector;
            let my_stealers = stealers.clone(); // 共享所有 stealers

            s.spawn(move |_| {
                loop {
                    let task = worker.pop()
                        .or_else(|| injector.steal_batch_and_pop(&worker))
                        .or_else(|| {
                            my_stealers.iter()
                                .filter(|s| !s.is_empty()) // 可优化，避免空 steal
                                .map(|s| s.steal())
                                .collect()
                        });

                    match task {
                        Some(file) => {
                            let _ = compress_file(&file.path, level, dry_run);
                        }
                        None => break, // 所有队列都空，结束
                    }
                }
            });
        }

        stealers
    }).unwrap();

    // scope 自动 join
}