Brent方法：融合二分法与插值的鲁棒求根算法原理与实践

原创于 2026-06-22 11:43:22 发布 · 520 阅读

5 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#Brent方法 #方程求根 #二分法

Summary 专栏收录该内容

380 篇文章

订阅专栏

1. 从“二分”到“混合”：为什么我们需要Brent方法？

如果你用过MATLAB的 fzero 函数，或者在一些数值计算的场景里寻找过方程的根，那你很可能已经在不知不觉中使用了Brent方法。这个标题里的“Zeroin”直译过来就是“找零点”，而“Brent’s Version”指的就是由Richard P. Brent在1973年提出的、现在被广泛认为是单变量方程求根领域最稳健、最高效的算法之一。它不是一个全新的发明，而是一个精巧的“集大成者”，把几种经典算法的优点糅合在一起，同时巧妙地避开了它们的缺点。

在数值计算里，给一个函数 f(x) ，找到满足 f(x)=0 的 x 值，这是个基础但至关重要的问题。最直观的想法可能是二分法：你有一个区间 [a, b] ，并且知道 f(a) 和 f(b) 异号（根据介值定理，零点肯定在里面），然后你就不断地把区间对半分，总能逼近零点。二分法非常可靠，它保证收敛，而且收敛速度是线性的——每迭代一次，不确定区间就缩小一半。但它的缺点也很明显：太慢了。尤其是在零点附近，函数值变化可能很剧烈，但二分法还是按部就班地“踱步”，不够聪明。

为了更快，人们想到了利用函数值信息的插值方法，比如割线法（Secant Method）。它用最近两次迭代点的函数值连一条直线（割线），用这条直线与x轴的交点作为新的猜测。这个方法在零点附近通常收敛得飞快，速度接近黄金分割率（约1.618阶），比二分法快得多。但是，割线法有个致命弱点：它不保证收敛。如果初始点选得不好，或者函数在迭代区间内不够“友好”，它可能会发散，或者陷入死循环。

那么，有没有一种方法，能像二分法一样保证找到根，又能像割线法一样在条件合适时快速收敛呢？这就是Brent方法要解决的核心问题。它的设计哲学非常务实： 在保证绝对安全（收敛）的前提下，尽可能快地奔跑 。算法内部有一个“监督机制”，它会评估每一次由割线法（或其变种，如逆二次插值）提出的新猜测点。如果这个新点落在当前的、有根保证的括号区间内，并且能显著缩短区间长度，那就采用这个“快速”的插值步。否则，算法就“保守”地退回去执行一步二分法。这种动态切换的策略，使得Brent方法兼具了鲁棒性和高效性。

我最初接触这个方法是在处理一些物理模型的参数反演时，方程形式复杂，导数难以求解（排除了牛顿法），且计算一次函数值成本很高。盲目用二分法太耗时，用纯割线法又怕跑飞。Brent方法就成了那个“既要又要”的最优解。接下来，我们就深入它的内部，看看这个“监督机制”和“混合策略”是如何具体实现的。

2. Brent方法的核心机制：一个“智能”的决策循环

Brent方法不是一个静态的公式，而是一个动态的迭代过程。它维护着几个关键状态变量，并在每一步做出“该用插值还是该用二分”的决策。理解这个决策逻辑，就理解了方法的精髓。

2.1 算法维护的关键状态

在迭代的每一步，算法都明确地知道一个“有根区间” [a, b] ，满足 f(a) * f(b) < 0 。同时，它记录三个点及其函数值：

b : 当前最好的近似根（即最新迭代点，其函数值 f(b) 的绝对值最小）。
a : 前一个迭代点，同时作为有根区间的一个端点。
c : 在 a 之前的那个迭代点。特别重要的是， c 被用来确保插值步骤使用的点不是同一个点重复使用，以避免退化。

此外，算法还记录：

d : 上一步迭代中使用的点（在Brent的原始论文中，这个变量有时记为 bprev ）。它主要用于判断是否可以进行逆二次插值。
一个标志位，记录上一步是采用了插值（快速步）还是二分（保守步）。

2.2 插值尝试：逆二次插值与割线法

算法优先尝试利用已有的函数值信息构造一个插值函数，并取其零点作为候选的新点 s 。这里有一个精妙的顺序：

逆二次插值（Inverse Quadratic Interpolation, IQI） ：如果 a , b , c 三个点互不相同（即 f(a) , f(b) , f(c) 两两不同），算法会尝试用这三个点进行逆二次插值。所谓“逆”，是指我们不是构造 x 关于 y 的二次函数，而是构造 y （即 f(x) ）关于 x 的二次函数，然后求 y=0 时的 x 。IQI的收敛阶数比割线法更高，在某些情况下能达到约1.839阶，是速度最快的选择。其公式推导基于拉格朗日插值，最终得到的 s 的表达式为： s = b + P / Q 其中， P = S * ( T * (R - T) * (c - b) - (1 - R) * (b - a) ) Q = (T - 1) * (R - 1) * (S - 1) 这里 R = f(b) / f(c) , S = f(b) / f(a) , T = f(a) / f(c) 。这个公式看起来复杂，但其本质是利用了三个点的函数值比例关系来外推零点。
割线法（Secant Method） ：如果IQI的条件不满足（比如点重合），算法则退而求其次，使用最新的两个点 b 和 a 进行割线法插值。公式大家很熟悉： s = b - f(b) * (b - a) / (f(b) - f(a)) 。

关键点 ：无论通过IQI还是割线法得到了候选点 s ，这都只是一个“提案”。算法不会无条件接受它。

2.3 “监督”与“裁决”：是否接受插值步？

这是Brent方法保证可靠性的核心。它设定了非常严格的接受准则，只有同时满足以下所有条件，候选点 s 才会被采纳为下一步的 b ：

括号条件 ： s 必须严格落在当前有根区间 (a, b) 的内部。这是保证收敛的基石。
收敛速度条件 ： s 不能离当前最佳点 b 太远。具体来说， |s - b| 必须小于等于 0.5 * |b - c| 。这里的 c 是上一步的 b （或更早的点）。这个条件防止算法在接近根时因为一个“大胆”的插值步而跳得太远，从而可能破坏收敛性甚至跳出括号区间。它确保了迭代点序列是“收缩”的。
进度条件 ： s 必须能带来足够的进展。即 |s - b| 必须小于等于 0.5 * |c - d| ，其中 d 是再上一步的迭代点。这个条件防止算法在进展缓慢时（比如因为函数在根附近非常平坦）反复进行无效的、小幅度的插值步。如果进展太小，不如做一次二分法来保证区间长度至少减半。

如果上述任何一个条件不满足，算法就会拒绝这次插值提案，转而执行一步 二分法 ：取区间的中点 m = (a + b) / 2 作为新的候选点 s 。

2.4 区间更新与变量轮换

一旦新的点 s 被确定（无论是来自被接受的插值还是二分法），并计算出 f(s) ，就需要更新状态：

根据 f(s) 和 f(b) 的符号，重新确定新的有根区间 [a, b] 。确保区间的端点函数值始终异号。
更新 b 为当前函数值绝对值最小的点（通常是 s 或原来的 b ）。
巧妙地轮换变量 c 和 d ，为下一次迭代准备好用于插值的“历史点”。

这个“提案-裁决-更新”的循环不断重复，直到区间长度 |b-a| 或函数值 |f(b)| 小于预设的容差（Tolerance）。整个流程就像一个谨慎的司机，在路况好时（插值条件满足）踩油门加速，路况不明或复杂时（条件不满足）立刻踩刹车换挡（用二分法），始终保证车辆（迭代）在正确的道路（有根区间）上安全行驶。

3. 与MATLAB `fzero` 的实战关联：不仅仅是调用

很多人知道MATLAB的 fzero 用了Brent方法，但可能不清楚具体细节和如何高效利用它。 fzero 的语法通常是 x = fzero(fun, x0) 或 x = fzero(fun, [a, b]) 。这里有一些教科书上不一定写的实战经验。

3.1 初始猜测的艺术：单点 vs. 区间

提供区间 [a, b] ：这是最稳妥的方式。你明确告诉 fzero 一个括号区间。算法会从这个区间开始运行，完全遵循标准的Brent流程。这是首选，尤其当你对根的位置有大致了解时。
提供单点 x0 ：这时 fzero 会先尝试在你给的 x0 附近寻找一个符号变化的区间。它会在 x0 两边进行试探性搜索，步长逐渐增大。 这里有个大坑 ：如果函数在 x0 附近没有变号（比如 f(x)=x^2 在0附近），或者变号点离 x0 非常远，这个搜索过程可能会失败，或者找到你根本不关心的远端根。我的经验是，尽量自己先确定一个括号区间。如果只能用单点，最好先手动画个函数图 ( fplot )，看看 x0 附近的情况。

3.2 容差（Tolerance）与输出设置

fzero 允许通过 optimset 设置选项，最常用的是 TolX （关于根的容差）和 TolFun （关于函数值的容差）。

options = optimset('TolX', 1e-12, 'TolFun', 1e-12, 'Display', 'iter');
x = fzero(@myfunc, [1, 2], options);

'Display', 'iter' ：强烈建议在调试阶段使用。它会打印每一步的迭代信息，包括当前的 a , b , f(a) , f(b) 。这能让你亲眼看到Brent方法在“插值”和“二分”之间切换的过程，对于理解算法行为和调试问题函数非常有帮助。
容差设置 ：默认的容差通常是 1e-6 。对于大多数工程问题足够了。但如果你需要更高精度，比如在验证数学性质或进行高精度计算时，可以将其调小。注意，设置得过小（如 1e-15 ）对于条件数很差的函数可能无法达到，反而导致无意义的迭代。

3.3 处理“坏”函数：不连续、多根与平坦区域

Brent方法很稳健，但也不是万能的。你需要了解它的边界。

不连续与奇点 ：如果函数在括号区间内有间断点或奇点（如除以零）， fzero 很可能会失败，因为它依赖于函数值的符号。它可能会把奇点误判为根（因为函数值可能从 +Inf 跳到 -Inf ）。 实战技巧 ：在函数定义里加入边界检查，用 try-catch 包装可能出错的运算，或者返回一个很大的数（如 NaN 或 Inf ）而不是让程序崩溃。 fzero 遇到 NaN 或 Inf 通常会停止并报错。
多根问题 ：Brent方法（以及 fzero ）一次只找一个根。如果你提供的括号区间 [a, b] 内有多个根，它最终会找到其中一个，但具体是哪一个取决于初始区间和函数形状，没有保证。要找到所有根，你需要结合函数图分析，将定义域划分成多个只包含单个根的区间，然后分别调用 fzero 。
非常平坦的区域 ：当根是一个重根（导数也为零）或函数在根附近极其平坦时，基于函数值符号的括号条件可能很难精确满足。 fzero 可能收敛得很慢，或者因为函数值在机器精度内无法区分正负而提前退出。这时，依赖 TolX （区间宽度）比依赖 TolFun （函数值）更可靠。

一个常见的调试场景是，你设置了很严格的容差，但 fzero 迭代几步就停了，返回的 f(x) 并不接近0。查看迭代输出（ Display 设为 iter ）往往会发现，区间 [a, b] 已经缩得非常小，但 f(a) 和 f(b) 始终同号。这通常意味着函数在这个微小区间内没有穿过零点，可能遇到了平坦区、不连续点，或者你的初始区间根本就没有把根括住。这时就需要回头检查函数定义和初始条件。

4. 自己动手实现一个简化版Brent方法

虽然我们总是直接调用 fzero ，但自己动手实现一个简化版的Brent方法（不考虑所有边缘情况）是深入理解它的最佳途径。下面我用MATLAB风格的伪代码来勾勒核心框架，并附上关键处的解释。

function [root, info] = my_brent(f, a, b, tol)
    % 简化版Brent方法实现
    % 输入：函数句柄 f，括号区间 [a, b]，容差 tol
    % 输出：根的近似值 root，以及包含迭代次数等的结构体 info

    fa = f(a);
    fb = f(b);
    if fa * fb >= 0
        error('初始区间[a, b]必须保证f(a)和f(b)异号。');
    end

    % 初始化：确保 |f(b)| <= |f(a)|，这样b是当前最佳点
    if abs(fa) < abs(fb)
        [a, b] = deal(b, a); % 交换a和b
        [fa, fb] = deal(fb, fa);
    end

    c = a; % 初始化c为a
    fc = fa;
    d = c; % 初始化d
    flag = true; % 标志位，上一步是否成功进行了插值？初始化为true

    iter = 0;
    max_iter = 100;

    while (abs(b - a) > tol) && (iter < max_iter)
        iter = iter + 1;

        % 步骤1：尝试插值（提案）
        s = 0;
        if (fa ~= fc) && (fb ~= fc)
            % 尝试逆二次插值 (IQI)
            s = a * fb * fc / ((fa - fb) * (fa - fc)) ...
                + b * fa * fc / ((fb - fa) * (fb - fc)) ...
                + c * fa * fb / ((fc - fa) * (fc - fb));
        end
        if (isnan(s) || isinf(s) || (~flag && (abs(s-b) >= 0.5*abs(b-c))) ... % 条件2、3的简化检查
            || (flag && (abs(s-b) >= 0.5*abs(c-d))) || (s <= min(a,b) || s >= max(a,b))) % 条件1
            % 如果IQI不可用或不满足条件，则用割线法
            s = b - fb * (b - a) / (fb - fa);
            % 如果割线法也不满足条件（主要是括号条件），则强制使用二分法
            if (s <= min(a,b) || s >= max(a,b)) || isnan(s) || isinf(s)
                s = (a + b) / 2;
                flag = false; % 这一步用了二分
            else
                flag = true; % 这一步用了插值（割线法）
            end
        else
            flag = true; % 这一步用了插值（IQI）
        end

        % 步骤2：计算f(s)并更新区间
        fs = f(s);
        d = c;
        c = b;
        fc = fb;

        if fa * fs < 0
            b = s;
            fb = fs;
        else
            a = s;
            fa = fs;
        end

        % 步骤3：确保b是当前最佳点（|f(b)|最小）
        if abs(fa) < abs(fb)
            [a, b] = deal(b, a);
            [fa, fb] = deal(fb, fa);
        end
    end

    root = b;
    info.iterations = iter;
    info.fval = fb;
end

实现要点与避坑指南：

变量交换的陷阱 ：代码中多次出现 [a, b] = deal(b, a); 这样的交换操作，目的是始终保持 b 是当前函数值绝对值最小的点。这是算法正确性的关键之一。在实现时，一定要同步交换对应的函数值 fa 和 fb ，否则会导致状态混乱。
插值公式的稳定性 ：上面给出的IQI公式是教科书形式，但在 fa , fb , fc 非常接近时，分母可能接近零，引入数值误差。工业级实现（如 fzero 或Netlib中的 zeroin ）会使用更稳定的代数变形来计算 s 。我们的简化版忽略了这部分，但在实际应用中需要处理。
条件判断的顺序与严谨性 ：完整的Brent方法对插值步的接受条件判断极其严谨。我们的简化版合并和省略了一些检查。在严格实现时，应完全按照2.3节所述的三个条件逐一判断。
收敛判断 ：循环终止条件除了区间宽度 (b-a) ，还应考虑函数值 f(b) 。通常采用混合条件： (abs(b-a) <= 2*tol*abs(b) + eps) 或 (abs(fb) <= tol) 。 eps 是机器精度，防止在 b 接近零时判断失效。

自己实现一遍后，你再回头去看 fzero 的迭代输出，会对每一步在做什么有恍然大悟的感觉。这也是为什么我建议每个做数值计算的人，都应该亲手实现几个关键算法，哪怕只是简化版。

5. 超越一维：Brent思想在优化与多维问题中的启示

Brent方法是为一维求根设计的，但其“混合策略”和“保证收敛前提下的加速”思想，在更广泛的数值计算领域有着深刻的影响。

一维优化（最小化） ：Brent本人将这种思想推广到了无导数一维优化问题，提出了著名的 Brent‘s minimization algorithm 。用于寻找单变量函数的最小值。它结合了抛物线插值（类比IQI）和黄金分割搜索（类比二分法），同样在保证收敛的前提下追求超线性收敛速度。MATLAB中的 fminbnd 函数就是基于此算法。
多维求根与优化 ：在多维情况下，虽然没有直接对应的“Brent方法”，但其哲学被体现在许多现代算法中。例如，在拟牛顿法（如BFGS）中，我们用一个不断更新的矩阵来近似Hessian矩阵（类比于利用历史信息构建局部模型），但在进行线搜索确定步长时，会采用类似“监督”的机制（如Wolfe条件），确保每一步都满足足够的下降量和曲率条件，从而在整体上保证收敛。这可以看作是多维空间中对“鲁棒性”和“快速收敛”的平衡。
算法选择的启发 ：Brent方法给我们的最大启发是： 没有一种算法在所有情况下都是最好的 。实用的、健壮的算法往往是“混合型”或“自适应型”的。它会在运行时根据当前遇到的问题特征（函数局部性质、收敛情况）动态选择最合适的子策略。在设计自己的数值例程时，这种思想非常值得借鉴。例如，在迭代求解大型线性方程组时，可能会先使用几轮收敛较慢但稳定的迭代法（如雅可比法）平滑误差，再切换到收敛快但对初始值敏感的迭代法（如共轭梯度法）。

回到我们日常使用的工具，无论是MATLAB的 fzero 、 fminbnd ，还是Python SciPy中的 scipy.optimize.brentq ，它们都是经过千锤百炼的工业级实现，处理了无数我们上面提到的边缘情况（如数值稳定性、精确的条件判断、浮点异常处理）。作为使用者，我们的价值在于理解其核心思想，知道它的强项和边界，从而在正确的问题上放心地使用它，并在它可能失效时（如多根、奇点）能迅速定位问题所在。

理解Brent方法，不仅仅是学会调用一个函数，更是学习一种构建可靠数值算法的思维方式：在追求效率的同时，永远把鲁棒性作为不可逾越的底线。这种思维，在你未来面对更复杂的建模、仿真和优化问题时，会持续带来回报。