C++ STL 之 optional、variant 与 any 详解
一、问题
C++ 类型系统在 C++17 之前有三大短板:
- 函数返回值无法优雅表达"可能无值"——传统做法用指针(可能空悬)或哨兵值(如
-1、nullptr),语义含混且易误用 - 需要"要么 A 要么 B"的类型安全变体——只能用
union,但原始union不检查活跃成员,读取错误成员属于未定义行为 - 需要持有任意类型的值(完全的动态类型)——过去只能退化为
void*+ 手动 RTTI,或继承方案
C++17 引入的 std::optional、std::variant、std::any 分别补上了这三个短板。
二、optional:可能无值的语义
2.1 基本用法
#include <optional>
#include <iostream>
#include <string>
std::optional<int> parse_int(const std::string& s) {
try {
return std::stoi(s);
} catch (...) {
return std::nullopt; // 无值
}
}
int main() {
auto r1 = parse_int("42");
auto r2 = parse_int("abc");
// has_value
std::cout << r1.has_value(); // 1
std::cout << r2.has_value(); // 0
// value_or 提供默认值
int v = r2.value_or(-1); // -1
// operator* / operator->(没有安全检查,需自己保证 has_value)
if (r1) {
std::cout << *r1; // 42
}
// value() 会抛 bad_optional_access
// r2.value(); // 抛异常
}
2.2 注意事项
optional<T>会存储额外的bool标记,如果T自身可以被默认构造为"空"状态(如std::string),不一定比哨兵值更省optional<T&>是 C++17 不支持的(C++23 才引入),引用包装推荐用std::reference_wrapper或裸指针value_or的参数是按值传入的,即使T是移动成本高的类型也会拷贝,注意用std::move或手动短路if(opt)
三、variant:类型安全的联合体
3.1 基本用法
#include <variant>
#include <string>
#include <iostream>
// 定义一个 "要么 int 要么 string" 的类型
std::variant<int, std::string> v = 42;
// 赋值另一个类型
v = "hello";
// 获取值——类型不匹配时抛 bad_variant_access
int i = std::get<int>(v); // 抛异常,当前是 string
std::string s = std::get<std::string>(v); // OK
// get_if 返回指针,失败返回 nullptr
if (auto* p = std::get_if<int>(&v)) {
std::cout << *p;
} else {
std::cout << "不是 int";
}
3.2 std::visit:编译期分派
std::visit 是 variant 的核心武器——它根据 variant 当前活跃的索引,在编译期生成所有分支的分派表,运行时只需查偏移:
auto visitor = [](auto&& arg) {
using T = std::decay_t<decltype(arg)>;
if constexpr (std::is_same_v<T, int>)
std::cout << "int: " << arg;
else if constexpr (std::is_same_v<T, std::string>)
std::cout << "string: " << arg;
};
std::visit(visitor, v); // 编译期分派,零虚函数开销
对比虚函数方案:std::visit 的分派时间与 variant 的备选类型数量是 O(1) 的(查索引跳转表),而虚函数需要一次虚表查址加一次间接调用。两种都很便宜,但 visit 不需要类层次继承,组合更灵活。
3.3 variant vs 传统 union
3.4 注意事项
variant的默认构造会构造第一个类型的默认值,如果第一个类型不可默认构造,variant 也不能默认构造。可以用std::monostate作为第一备选来做"空"语义- 访问不活跃成员抛异常:
std::get抛std::bad_variant_access,std::get_if返回nullptr valueless_by_exception():赋值时如果异常发生,variant 可能进入无值状态,一般情况下应避免让其进入此态
四、any:类型擦除的通用容器
4.1 基本用法
#include <any>
#include <iostream>
#include <string>
std::any a = 42; // 存 int
a = std::string("hello"); // 存 string
a = 3.14; // 存 double
// 取出时必须类型完全一致
try {
double d = std::any_cast<double>(a); // OK
int i = std::any_cast<int>(a); // 抛 bad_any_cast
} catch (const std::bad_any_cast& e) {
std::cout << e.what();
}
// any_cast 指针版本,失败返回 nullptr
if (auto* p = std::any_cast<double>(&a)) {
std::cout << *p;
}
4.2 性能代价
std::any 的实现内部做两次动态分配(堆 + 类型擦除包装器):
- 对于小对象(通常 ≤ 32 字节且可平凡拷贝),实现可能用 SBO(小对象优化)避免堆分配,但不可平凡拷贝的大对象一定堆分配
- 每次
std::any_cast<T>内部通过typeid比较运行时类型信息(RTTI),有运行时代价 - 与
optional(零堆分配)和variant(栈上存储 + 编译期)相比,any是最重的方案
结论:除非必须持有运行时才能确定的任意类型,否则优先用 optional 或 variant。
五、选型指南
六、面试题
Q1:optional<T> 和裸指针有什么区别?
A:裸指针可以表达空(nullptr)但有歧义——它是"没有值"还是"指向的对象被销毁"?optional 语义明确,且支持 value_or、has_value、and_then(C++23)等组合子,不可空悬。
Q2:optional<T> 的空间开销是多少?
A:额外一个 bool(通常 1 字节 + padding),对齐由 T 决定。如果 T 自身有"空"状态(如 std::string 的空字符串),optional 并不比带哨兵的版本省空间,但语义更清晰。
Q3:std::visit 比虚函数快吗?
A:实测两者在同一量级。std::visit 通过索引跳转表 O(1) 分派,但编译器倾向于把虚函数内联。关键区别在组合:variant + visit 不需要类层次,新增类型只需扩展 variant 类型参数,不侵入已有代码。
Q4:variant 的空状态是怎么回事?
A:默认构造构造第一个类型;如果赋值时发生异常,variant 可能进入 valueless_by_exception() 为 true 的状态,此时任何 get 和 visit 都会抛异常。可以用 std::monostate 作为第一类型(占位 0 字节)来手动管理空状态。
Q5:std::any 为什么比 variant 慢?
A:因为 any 做类型擦除用到虚函数包装器和堆分配,且 any_cast 依赖 typeid 运行时比较;variant 的所有备选类型编译期已知,存储在栈上,分派是编译期构造的索引表。
Q6:请用合适的工具实现一个能存 int、double、string 之一的类型,应选 variant 还是 any?为什么?
A:选 variant<int, double, string>。因为类型集合编译期完全确定,variant 零堆分配、O(1) 分派、类型安全。any 会引入不必要的动态分配和 RTTI 查询。
Q7:optional、variant、any 能否组合使用?
A:可以。例如 optional<variant<int, string>> 表示"要么没有值,要么是 int 或 string";variant<int, any> 可以表达"已知 int 或其类型未知的"——但后者在实践中很少用,因为 any 已经包揽了"任意"语义。

1143

被折叠的 条评论
为什么被折叠?



