item20¶

条款二十：当 `std::shard_ptr` 可能悬空时使用 `std::weak_ptr`¶

Item 20: Use std::weak_ptr for std::shared_ptr-like pointers that can dangle

自相矛盾的是，如果有一个像 std::shared_ptr（见 Item19）的但是不参与资源所有权共享的指针是很方便的。换句话说，是一个类似 std::shared_ptr 但不影响对象引用计数的指针。这种类型的智能指针必须要解决一个 std::shared_ptr 不存在的问题：可能指向已经销毁的对象。一个真正的智能指针应该跟踪所指对象，在悬空时知晓，悬空（dangle）就是指针指向的对象不再存在。这就是对 std::weak_ptr 最精确的描述。

你可能想知道什么时候该用 std::weak_ptr。你可能想知道关于 std::weak_ptr API 的更多。它什么都好除了不太智能。std::weak_ptr 不能解引用，也不能测试是否为空值。因为 std::weak_ptr 不是一个独立的智能指针。它是 std::shared_ptr 的增强。

这种关系在它创建之时就建立了。std::weak_ptr 通常从 std::shared_ptr 上创建。当从 std::shared_ptr 上创建 std::weak_ptr 时两者指向相同的对象，但是 std::weak_ptr 不会影响所指对象的引用计数：

auto spw =                      //spw创建之后，指向的Widget的
    std::make_shared<Widget>(); //引用计数（ref count，RC）为1。
                                //std::make_shared的信息参见条款21
…
std::weak_ptr<Widget> wpw(spw); //wpw指向与spw所指相同的Widget。RC仍为1
…
spw = nullptr;                  //RC变为0，Widget被销毁。
                                //wpw现在悬空

悬空的 std::weak_ptr 被称作已经 expired（过期）。你可以用它直接做测试：

if (wpw.expired()) …            //如果wpw没有指向对象…

但是通常你期望的是检查 std::weak_ptr 是否已经过期，如果没有过期则访问其指向的对象。这做起来可不是想着那么简单。因为缺少解引用操作，没有办法写这样的代码。即使有，将检查和解引用分开会引入竞态条件：在调用 expired 和解引用操作之间，另一个线程可能对指向这对象的 std::shared_ptr 重新赋值或者析构，并由此造成对象已析构。这种情况下，你的解引用将会产生未定义行为。

你需要的是一个原子操作检查 std::weak_ptr 是否已经过期，如果没有过期就访问所指对象。这可以通过从 std::weak_ptr 创建 std::shared_ptr 来实现，具体有两种形式可以从 std::weak_ptr 上创建 std::shared_ptr，具体用哪种取决于 std::weak_ptr 过期时你希望 std::shared_ptr 表现出什么行为。一种形式是 std::weak_ptr::lock，它返回一个 std::shared_ptr，如果 std::weak_ptr 过期这个 std::shared_ptr 为空：

std::shared_ptr<Widget> spw1 = wpw.lock();  //如果wpw过期，spw1就为空

auto spw2 = wpw.lock();                     //同上，但是使用auto

另一种形式是以 std::weak_ptr 为实参构造 std::shared_ptr。这种情况中，如果 std::weak_ptr 过期，会抛出一个异常：

std::shared_ptr<Widget> spw3(wpw);          //如果wpw过期，抛出std::bad_weak_ptr异常

但是你可能还想知道为什么 std::weak_ptr 就有用了。考虑一个工厂函数，它基于一个唯一 ID 从只读对象上产出智能指针。根据 Item18 的描述，工厂函数会返回一个该对象类型的 std::unique_ptr：

std::unique_ptr<const Widget> loadWidget(WidgetID id);

如果调用 loadWidget 是一个昂贵的操作（比如它操作文件或者数据库 I/O）并且重复使用 ID 很常见，一个合理的优化是再写一个函数除了完成 loadWidget 做的事情之外再缓存它的结果。当每个请求获取的 Widget 阻塞了缓存也会导致本身性能问题，所以另一个合理的优化可以是当 Widget 不再使用的时候销毁它的缓存。

对于可缓存的工厂函数，返回 std::unique_ptr 不是好的选择。调用者应该接收缓存对象的智能指针，调用者也应该确定这些对象的生命周期，但是缓存本身也需要一个指针指向它所缓存的对象。缓存对象的指针需要知道它是否已经悬空，因为当工厂客户端使用完工厂产生的对象后，对象将被销毁，关联的缓存条目会悬空。所以缓存应该使用 std::weak_ptr，这可以知道是否已经悬空。这意味着工厂函数返回值类型应该是 std::shared_ptr，因为只有当对象的生命周期由 std::shared_ptr 管理时，std::weak_ptr 才能检测到悬空。

下面是一个临时凑合的 loadWidget 的缓存版本的实现：

std::shared_ptr<const Widget> fastLoadWidget(WidgetID id)
{
    static std::unordered_map<WidgetID,
                              std::weak_ptr<const Widget>> cache;
                                        //译者注：这里std::weak_ptr<const Widget>是高亮
    auto objPtr = cache[id].lock();     //objPtr是去缓存对象的
                                        //std::shared_ptr（或
                                        //当对象不在缓存中时为null）

    if (!objPtr) {                      //如果不在缓存中
        objPtr = loadWidget(id);        //加载它
        cache[id] = objPtr;             //缓存它
    }
    return objPtr;
}

这个实现使用了 C++11 的 hash 表容器 std::unordered_map，但是需要的 WidgetID 哈希和相等性比较函数在这里没有展示。

fastLoadWidget 的实现忽略了以下事实：缓存可能会累积过期的 std::weak_ptr，这些指针对应了不再使用的 Widget（也已经被销毁了）。其实可以改进实现方式，但是花时间在这个问题上不会让我们对 std::weak_ptr 有更深入的理解，让我们考虑第二个用例：观察者设计模式（Observer design pattern）。此模式的主要组件是 subjects（状态可能会更改的对象）和 observers（状态发生更改时要通知的对象）。在大多数实现中，每个 subject 都包含一个数据成员，该成员持有指向其 observers 的指针。这使 subjects 很容易发布状态更改通知。subjects 对控制 observers 的生命周期（即它们什么时候被销毁）没有兴趣，但是 subjects 对确保另一件事具有极大的兴趣，那事就是一个 observer 被销毁时，不再尝试访问它。一个合理的设计是每个 subject 持有一个 std::weak_ptrs 容器指向 observers，因此可以在使用前检查是否已经悬空。

作为最后一个使用 std::weak_ptr 的例子，考虑一个持有三个对象 A、B、C 的数据结构，A 和 C 共享 B 的所有权，因此持有 std::shared_ptr：

item20_fig1

假定从 B 指向 A 的指针也很有用。应该使用哪种指针？

item20_fig2

有三种选择：

原始指针。使用这种方法，如果 A 被销毁，但是 C 继续指向 B，B 就会有一个指向 A 的悬空指针。而且 B 不知道指针已经悬空，所以 B 可能会继续访问，就会导致未定义行为。
std::shared_ptr。这种设计，A 和 B 都互相持有对方的 std::shared_ptr，导致的 std::shared_ptr 环状结构（A 指向 B，B 指向 A）阻止 A 和 B 的销毁。甚至 A 和 B 无法从其他数据结构访问了（比如，C 不再指向 B），每个的引用计数都还是 1。如果发生了这种情况，A 和 B 都被泄漏：程序无法访问它们，但是资源并没有被回收。
std::weak_ptr。这避免了上述两个问题。如果 A 被销毁，B 指向它的指针悬空，但是 B 可以检测到这件事。尤其是，尽管 A 和 B 互相指向对方，B 的指针不会影响 A 的引用计数，因此在没有 std::shared_ptr 指向 A 时不会导致 A 无法被销毁。

使用 std::weak_ptr 显然是这些选择中最好的。但是，需要注意使用 std::weak_ptr 打破 std::shared_ptr 循环并不常见。在严格分层的数据结构比如树中，子节点只被父节点持有。当父节点被销毁时，子节点就被销毁。从父到子的链接关系可以使用 std::unique_ptr 很好的表征。从子到父的反向连接可以使用原始指针安全实现，因为子节点的生命周期肯定短于父节点。因此没有子节点解引用一个悬垂的父节点指针这样的风险。

当然，不是所有的使用指针的数据结构都是严格分层的，所以当发生这种情况时，比如上面所述缓存和观察者列表的实现之类的，知道 std::weak_ptr 随时待命也是不错的。

从效率角度来看，std::weak_ptr 与 std::shared_ptr 基本相同。两者的大小是相同的，使用相同的控制块（参见 Item19），构造、析构、赋值操作涉及引用计数的原子操作。这可能让你感到惊讶，因为本条款开篇就提到 std::weak_ptr 不影响引用计数。我写的是 std::weak_ptr 不参与对象的 共享所有权，因此不影响 指向对象的引用计数。实际上在控制块中还是有第二个引用计数，std::weak_ptr 操作的是第二个引用计数。想了解细节的话，继续看 Item21 吧。

请记住：

用 std::weak_ptr 替代可能会悬空的 std::shared_ptr。
std::weak_ptr 的潜在使用场景包括：缓存、观察者列表、打破 std::shared_ptr 环状结构。

item20¶

条款二十：当 std::shard_ptr 可能悬空时使用 std::weak_ptr¶

条款二十：当 `std::shard_ptr` 可能悬空时使用 `std::weak_ptr`¶