31、Python 任务调度与并发测试全解析

Python 任务调度与并发测试全解析

在 Python 编程中,任务调度和并发测试是两个重要的方面。任务调度可以帮助我们在特定时间或间隔执行任务,而并发测试则有助于提高测试效率。下面将详细介绍相关内容。

1. 执行器类选择

在安排任务稍后执行的过程中,选择合适的执行器至关重要。一般来说,默认的执行器 ThreadPoolExecutor 会在同一进程的不同线程间分配工作,是比较推荐的选择。但如果任务包含 CPU 密集型操作,就应将工作负载分配到多个 CPU 核心,此时需使用 ProcessPoolExecutor

这两个执行器类与 concurrent.futures 模块相互协作,以实现并发执行。它们的默认最大工作线程数均为 10,可在初始化时进行更改。

2. 触发关键字

构建调度器时,最后要决定的是任务未来的执行方式,即事件触发选项。APScheduler 提供了三种触发机制,需将相应关键字作为参数传递给调度器初始化器来指定触发类型:
- date :用于在未来特定时间点执行一次的任务。
- interval :用于按固定时间间隔执行的任务。
- cron :用于在每天特定时间定期执行的任务。

此外,还可以混合使用多种触发类型,并且可以选择在所有注册的触发器都满足条件时执行任务,或者只要有一个触发器满足条件就执行。

3. 常见调度器方法

调度器对象常用的方法如下:
- add_executor() :注册一个执行器以在未来运行任务。通常传入字符串 'processpool' 可将任务分布到多个进程,否则默认使用线程池执行器。该方法会返回一个可进一步操作的执行器对象。
- remove_executor() :从调度器中移除一个执行器对象。
- add_job() :向任务列表中添加一个额外的任务。该方法首先接受一个可调用对象作为新任务,还可接受其他参数来指定任务的调度和执行方式。与 add_executor() 类似,它也会返回一个可在方法外操作的任务对象。
- remove_job() :从调度器中移除一个任务对象。
- start() :启动调度的任务和已实现的执行器,并开始处理任务列表。
- shutdown() :停止调用的调度器对象及其任务列表和执行器。如果在有任务正在运行时调用,这些任务不会被中断。

4. Python 示例

以下是一些使用相关 API 的 Python 示例。

4.1 阻塞调度器
# Chapter19/example1.py
from datetime import datetime
from apscheduler.schedulers.background import BlockingScheduler

def tick():
    print(f'Tick! The time is: {datetime.now()}')

if __name__ == '__main__':
    scheduler = BlockingScheduler()
    scheduler.add_job(tick, 'interval', seconds=3)
    try:
        scheduler.start()
        print('Printing in the main thread.')
    except KeyboardInterrupt:
        pass
    scheduler.shutdown()

在这个示例中,使用 BlockingScheduler tick() 函数创建调度器。 add_job() 方法将 tick() 注册为定期执行的任务,每 3 秒执行一次。由于阻塞调度器会阻塞同一进程中的其他指令,所以 print('Printing in the main thread.') 不会执行。

4.2 后台调度器
# Chapter19/example2.py
from datetime import datetime
import time
from apscheduler.schedulers.background import BackgroundScheduler

def tick():
    print(f'Tick! The time is: {datetime.now()}')

if __name__ == '__main__':
    scheduler = BackgroundScheduler()
    scheduler.add_job(tick, 'interval', seconds=3)
    scheduler.start()
    try:
        while True:
            time.sleep(2)
            print('Printing in the main thread.')
    except KeyboardInterrupt:
        pass
    scheduler.shutdown()

此示例使用 BackgroundScheduler ,并在主程序中添加了一个无限循环,每 2 秒打印一条消息。从输出可以看出,主程序和调度任务的打印语句会并发输出,说明调度器在后台运行。

4.3 执行器池
# Chapter19/example3.py
from datetime import datetime
import time
import os
from apscheduler.schedulers.background import BackgroundScheduler

def task():
    print(f'From process {os.getpid()}: The time is {datetime.now()}')
    print(f'Starting job inside {os.getpid()}')
    time.sleep(4)
    print(f'Ending job inside {os.getpid()}')

if __name__ == '__main__':
    scheduler = BackgroundScheduler()
    scheduler.add_executor('processpool')
    scheduler.add_job(task, 'interval', seconds=3, max_instances=3)
    scheduler.start()
    try:
        while True:
            time.sleep(1)
    except KeyboardInterrupt:
        pass
    scheduler.shutdown()

该程序使用后台调度器,并通过 add_executor('processpool') 指定使用进程池执行任务。 add_job() 方法中设置 max_instances=3 表示该任务可以在多个进程实例中执行。从输出的进程标识符可以看出,任务在不同进程中执行。

4.4 云环境运行示例
# ch19/example4.py
# Copied from: http://devcenter.heroku.com/articles/clock-processes-python
from apscheduler.schedulers.blocking import BlockingScheduler

scheduler = BlockingScheduler()

@scheduler.scheduled_job('interval', minutes=3)
def timed_job():
    print('This job is run every three minutes.')

@scheduler.scheduled_job('cron', day_of_week='mon-fri', hour=17)
def scheduled_job():
    print('This job is run every weekday at 5pm.')

scheduler.start()

此示例使用装饰器为调度器注册任务。 @scheduler.scheduled_job 可将函数转换为调度任务,还展示了 cron 触发类型的使用,即每周一至周五下午 5 点执行任务。

5. Python 中的测试与并发

测试是软件开发和编程中不可或缺的一部分,其目的是引发能表明程序中存在错误的异常,这与调试不同,调试是用于识别错误本身。

5.1 并发程序测试

测试并发程序极具挑战性,因为并发程序中的死锁或竞态条件等错误可能很隐蔽,且并发具有不确定性,导致并发错误可能在一次测试中被检测到,而在另一次测试中消失。这种测试被称为不可重现测试。不过,有一些通用策略可帮助我们进行并发程序测试。

5.2 单元测试

单元测试是测试程序中各个独立单元的方法,单元是程序中最小的可测试部分。因此,单元测试不适用于测试完整的并发系统,建议将并发程序分解为较小的组件分别进行测试。

Python 的 unittest 模块提供了直观的 API 来进行单元测试。以下是一个测试斐波那契数列函数的示例:

# Chapter19/example5.py
import unittest

def fib(i):
    if i in [0, 1]:
        return i
    return fib(i - 1) + fib(i - 2)

class FibTest(unittest.TestCase):
    def test_start_values(self):
        self.assertEqual(fib(0), 0)
        self.assertEqual(fib(1), 1)

    def test_other_values(self):
        self.assertEqual(fib(10), 55)

if __name__ == '__main__':
    unittest.main()

在这个示例中, FibTest 类继承自 unittest.TestCase ,包含了测试斐波那契数列起始值和其他值的方法。运行脚本后,若输出显示测试通过,则说明代码在测试的情况下表现正常。

5.3 静态代码分析

静态代码分析是通过查看代码本身的模式来识别潜在错误和漏洞的方法,而不是执行代码。其主要优点是不依赖程序的执行结果来判断程序设计是否正确,能检测到在测试中不易显现的错误。静态代码分析应与其他测试方法(如单元测试)结合使用,以形成全面的测试过程。

常见的 Python 静态代码分析工具包括 PMD(https://github.com/pmd/pmd),但具体使用方法超出了本文范围。

5.4 并发测试程序

并发测试是指以并发方式执行测试,比测试并发程序本身更直接和直观。 concurrencytest 库可与 unittest 模块无缝协作,提高测试速度。

安装步骤如下:
1. 安装 concurrencytest

pip install concurrencytest
  1. 安装依赖库:
pip install testtools
pip install python-subunit
  1. 验证安装:
>>> import concurrencytest

若没有打印错误信息,则说明安装成功。

以下是使用 concurrencytest 进行并发测试的示例:

# Chapter19/example7.py
import unittest
from concurrencytest import ConcurrentTestSuite, fork_for_tests

def fib(i):
    if i in [0, 1]:
        return i
    a, b = 0, 1
    n = 1
    while n < i:
        a, b = b, a + b
        n += 1
    return b

class FibTest(unittest.TestCase):
    def __init__(self, *args, **kwargs):
        super(FibTest, self).__init__(*args, **kwargs)
        self.mod = 10 ** 10

    def test_start_values(self):
        self.assertEqual(fib(0), 0)
        self.assertEqual(fib(1), 1)

    def test_big_value_v1(self):
        self.assertEqual(fib(499990) % self.mod, 9998843695)

    def test_big_value_v2(self):
        self.assertEqual(fib(499995) % self.mod, 1798328130)

    def test_big_value_v3(self):
        self.assertEqual(fib(500000) % self.mod, 9780453125)

if __name__ == '__main__':
    suite = unittest.TestLoader().loadTestsFromTestCase(FibTest)
    concurrent_suite = ConcurrentTestSuite(suite, fork_for_tests(4))
    runner = unittest.TextTestRunner()
    runner.run(concurrent_suite)

此示例中,通过 ConcurrentTestSuite 类和 fork_for_tests(4) 指定使用四个独立进程来分布测试过程,相比顺序测试,速度有显著提升。

综上所述,APScheduler 为 Python 应用程序的调度提供了丰富的选项,而合理运用测试和并发技术能提高程序的质量和测试效率。

Python 任务调度与并发测试全解析

6. 测试方法对比与总结

为了更清晰地了解不同测试方法的特点和适用场景,下面对单元测试、静态代码分析和并发测试进行对比总结:

测试方法 特点 适用场景 优点 缺点
单元测试 对程序的最小可测试单元进行测试,将程序分解为小组件分别测试 并发程序的组件测试,验证单个函数或类的功能 能精确找出单个组件的问题,定位错误快 不适用于测试完整的并发系统
静态代码分析 不执行代码,通过查看代码结构、变量使用和交互来识别潜在错误 查找代码中的潜在问题,如未使用的变量、空的异常捕获块等 能检测到在测试中不易显现的错误,不依赖程序执行结果 无法检测到运行时才出现的错误
并发测试 以并发方式执行测试,提高测试速度 有大量测试用例,需要快速完成测试的场景 显著提高测试速度,减少测试时间 可能存在创建并发测试套件的开销
7. 不同调度器的使用场景分析

不同类型的调度器适用于不同的场景,下面对阻塞调度器和后台调度器的使用场景进行分析:

graph LR
    classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    classDef decision fill:#FFF6CC,stroke:#FFBC52,stroke-width:2px;

    A([开始]):::startend --> B{是否需要阻塞主线程?}:::decision
    B -->|是| C(使用阻塞调度器):::process
    B -->|否| D(使用后台调度器):::process
    C --> E(适用于程序主要任务为调度任务的场景):::process
    D --> F(适用于需要在后台运行调度任务,同时主线程继续执行其他任务的场景):::process
    E --> G([结束]):::startend
    F --> G
  • 阻塞调度器 :当程序的主要任务是调度任务,不需要主线程同时执行其他任务时,可使用阻塞调度器。例如,一个专门用于定时执行任务的脚本,使用阻塞调度器可以确保调度任务的稳定执行。
  • 后台调度器 :当需要在后台运行调度任务,同时主线程继续执行其他任务时,应使用后台调度器。比如,在一个 Web 应用中,需要在后台定时执行一些数据处理任务,同时主线程继续处理用户请求,此时使用后台调度器就非常合适。
8. 执行器选择的考虑因素

在选择执行器时,需要考虑任务的性质和系统资源,以下是选择执行器的流程:

graph LR
    classDef startend fill:#F5EBFF,stroke:#BE8FED,stroke-width:2px;
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    classDef decision fill:#FFF6CC,stroke:#FFBC52,stroke-width:2px;

    A([开始]):::startend --> B{任务是否为 CPU 密集型?}:::decision
    B -->|是| C(使用 ProcessPoolExecutor):::process
    B -->|否| D(使用 ThreadPoolExecutor):::process
    C --> E(将工作负载分配到多个 CPU 核心):::process
    D --> F(在同一进程的不同线程间分配工作):::process
    E --> G([结束]):::startend
    F --> G
  • ThreadPoolExecutor :适用于 I/O 密集型任务,因为在 I/O 操作时线程会处于等待状态,此时可以切换到其他线程执行任务,充分利用 CPU 资源。
  • ProcessPoolExecutor :适用于 CPU 密集型任务,将任务分配到多个 CPU 核心,提高处理速度。
9. 总结与建议

通过对 Python 任务调度和并发测试的学习,我们了解了不同的调度器、执行器、触发机制和测试方法。为了更好地使用这些技术,提出以下建议:
- 调度器选择 :根据程序的需求选择合适的调度器,若程序主要用于调度任务,可使用阻塞调度器;若需要在后台运行调度任务,同时主线程继续执行其他任务,则使用后台调度器。
- 执行器选择 :根据任务的性质选择执行器,I/O 密集型任务使用 ThreadPoolExecutor ,CPU 密集型任务使用 ProcessPoolExecutor
- 触发机制使用 :根据任务的执行时间要求选择合适的触发机制,可混合使用多种触发类型以满足复杂的调度需求。
- 测试方法结合 :将单元测试、静态代码分析和并发测试结合使用,形成全面的测试过程,提高程序的质量和稳定性。

总之,APScheduler 为 Python 应用程序的调度提供了丰富的选项,合理运用测试和并发技术能提高程序的质量和测试效率,帮助开发者更好地开发和维护 Python 程序。

内容概要:本文出自罗兰贝格关于工业4.0现状的报告,系统分析了制造业在数字化转型过程中的实际进展挑战。报告指出,尽管“工业4.0”概念提出已逾十年,但多数企业仍未实现预期的智能化、自组织生产目标,主要受限于技术复杂性、组织孤岛、投资回报周期长及人才短缺等问题。通过对领先制造企业的研究,报告提炼出三大成功要素:一是制定基于现实的工业4.0愿景面战略,明确用例优先级;二是建立“中心辐射式”组织架构,设立专职数字化制造部门,推动跨职能协作规模化落地;三是构建统一的IT/OT目标架构,强化数据生态系统互操作性。报告特别强调,高价值用例如预测性维护、实时参数优化、视觉检测等已在汽车半导体行业显现显著成效,企业应聚焦可量化回报的场景,结合资源现实,分阶段推进转型。; 适合人群:制造业企业管理者、数字化转型负责人、工业互联网从业者及政策制定者; 使用场景及目标:①帮助企业评估自身工业4.0成熟度并制定务实发展战略;②为制造企业设计组织架构IT/OT技术路线图提供参考;③指导资源优先配置于高价值数字化用例,提升投资回报率; 阅读建议:建议结合企业实际生产场景阅读,重点关注“中心辐射式”运营模式六大高价值用例的适用性分析,同时参考报告中的汽车行业案例,因地制宜地规划数字化路径。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值