GreatSQL TPC-H 性能测试报告正式发布!

file

GreatSQL TPC-H 性能测试报告 - (2024 年 2 月28日)

完整性能测试报告:https://greatsql.cn/docs/8032-25/user-manual/10-optimze/3-3-benchmark-greatsql-tpch-report.html

1、概述

本次测试针对GreatSQL数据库基于标准 TPC-H 场景的测试。

TPC-H(商业智能计算测试)是美国交易处理效能委员会(TPC,TransactionProcessing Performance Council)组织制定的用来模拟决策支持类应用的一个测试集。目前,学术界和工业界普遍采用 TPC-H 来评价决策支持技术方面应用的性能。这种商业测试可以全方位评测系统的整体商业计算综合能力,对厂商的要求更高,同时也具有普遍的商业实用意义,目前在银行信贷分析和信用卡分析、电信运营分析、税收分析、烟草行业决策分析中都有广泛的应用,TPC-H 查询包含八张数据表和 22 条复杂 SQL 查询,大多数查询包含多表联接(JOIN)、子查询和聚合查询等。

GreatSQL数据库是一款开源免费数据库,可在普通硬件上满足金融级应用场景,具有高可用高性能高兼容高安全等特性,可作为MySQL或Percona Server for MySQL的理想可选替换。

2、测试环境

配置备注
操作系统OS:CentOS Linux release 7.9.2009 (Core)
内核:3.10.0-1160.el7.x86_64
CPUIntel(R) Xeon(R) Gold 6238 CPU @ 2.10GHz * 4
内存251G
磁盘INTEL SSDPE2KE032T8
数据库GreatSQL 8.0.32-25, Release 25, Revision 79f57097e3f

提示:在下面运行TPC-H测试时,设置了Rapid引擎最大可使用的内存及线程数。

greatsql> SET GLOBAL rapid_memory_limit = 68719476736;
greatsql> SET GLOBAL rapid_worker_threads = 32;

3、测试表结构和数据量

各表数据量对比:

表名TPC-H SF100数据量TPC-H SF300数据量备注
region55地区信息
nation2525国家表
supplier10000003000000供应商信息
part2000000060000000零件表
customer1500000045000000消费者表
partsupp80000000240000000配件供应表
orders150000000450000000订单表
lineitem6000379021799989091订单明细表

Rapid引擎表空间压缩率:

库名InnoDB表空间文件总大小Rapid引擎表空间总大小压缩率
TPC-H SF100184570593436287283732486.42
TPC-H SF300591644573888743348644437.96

各表结构关系如下图所示:

file

4、测试结果

GreatSQL 8.0.32-25中,采用全新的Rapid存储引擎,使得其在TPC-H性能测试中表现大大优于此前的其他版本,也大大优于MySQL社区版、Percona Server MySQL、MariaDB等数据库。

在TPC-H SF100场景下,运行完全部22个TPC-H查询SQL总耗时为79.28秒。在TPC-H SF300场景下,运行完全部22个TPC-H查询SQL总耗时为386.195秒

每条SQL详细耗时如下:

TPC-H QueryGreatSQL TPC-H SF100(32C64G)耗时(秒)GreatSQL TPC-H SF300(32C64G)耗时(秒)
Q11.1843.537
Q20.9243.865
Q31.3244.167
Q43.67822.712
Q51.2874.119
Q60.3440.959
Q75.4850.217
Q81.133.534
Q97.31131.872
Q102.88515.301
Q110.4770.921
Q120.7992.294
Q133.75810.997
Q140.9662.471
Q152.83111.898
Q161.1943.487
Q178.53727.523
Q1813.007108.237
Q191.8924.046
Q204.2110.668
Q2111.96560.084
Q222.5133.286
总耗时77.696386.195

GreatSQL SF100 vs SF300(32C64G)对比示意图如下

file

5、测试步骤

5.1 安装 GreatSQL

请参考GreatSQL手册内容:安装指南https://greatsql.cn/docs/8032-25/user-manual/4-install-guide/0-install-guide.html 完成GreatSQL安装。

5.2 生成 TPC-H 测试数据

请参考GreatSQL手册内容:TPC-H性能测试https://greatsql.cn/docs/8032-25/user-manual/10-optimze/3-2-benchmark-tpch.html 完成TPC-H工具编译安装。

运行 TPC-H dbgen 工具,生成数据文件,一共会生成 8 个表对应的 tbl 数据文件,例如:

$ ./dbgen -vf -s 100
...

$ ls -l *tbl
-rw-r--r-- 1 root root  2463490271 Sep 26 09:20 customer.tbl
-rw-r--r-- 1 root root 79579694556 Sep 26 09:20 lineitem.tbl
-rw-r--r-- 1 root root        2224 Sep 26 09:20 nation.tbl
-rw-r--r-- 1 root root 17793116301 Sep 26 09:20 orders.tbl
-rw-r--r-- 1 root root 12209211160 Sep 26 09:20 partsupp.tbl
-rw-r--r-- 1 root root  2453234158 Sep 26 09:20 part.tbl
-rw-r--r-- 1 root root         389 Sep 26 09:20 region.tbl
-rw-r--r-- 1 root root   142869803 Sep 26 09:20 supplier.tbl

也可以参考 duckdb_dbgen.pyhttps://gitee.com/GreatSQL/GreatSQL-Doc/blob/master/tpch/3.0.1/duckdb_dbgen.py 脚本做法,利用duckdb并行生成测试数据。

5.3 创建 TPC-H 测试数据库表并导入数据

参考GreatSQL社区提供的TPC-H数据库表初始化脚本:tpch-create-table.sqlhttps://gitee.com/GreatSQL/GreatSQL-Doc/blob/master/tpch/3.0.1/tpch-create-table.sql 完成TPC-H测试数据库表创建。

$ mysql -f < tpch-create-table.sql
$ mysqlshow tpch100
Database: tpch100
+----------+
|  Tables  |
+----------+
| customer |
| lineitem |
| nation   |
| orders   |
| part     |
| partsupp |
| region   |
| revenue0 |
| supplier |
+----------+

利用GreatSQL的 parallel load data特性https://greatsql.cn/docs/8032-25/user-manual/5-enhance/5-1-highperf-parallel-load.html 并行导入TPC-H测试数据。

需要先修改GreatSQL选项secure_file_priv设置,指向上述 workdir 所在目录,重启GreatSQL使之生效。

参考GreatSQL社区提供的并发导入脚本:load-data-parallel.shhttps://gitee.com/GreatSQL/GreatSQL-Doc/blob/master/tpch/3.0.1/load-data-parallel.sh 完成数据导入。

提示:运行LOAD DATA导入数据时,可能会在 tmpdir 产生临时文件,因此要保证 tmpdir 有足够的剩余可用磁盘空间。

5.4 确认Rapid引擎设置,并加载数据到secondary engine

数据导入完成后,在开始运行TPC-H测试前,需要先将测试数据加载到secondary engine引擎中。

先执行下面命令,动态修改Rapid引擎最大可使用内存,其余相关选项均为默认值:

greatsql> SET GLOBAL rapid_memory_limit = 68719476736;
greatsql> SET GLOBAL rapid_worker_threads = 32;

之后,执行以下命令加载测试数据到secondary engine:

greatsql> alter table customer secondary_load;
alter table lineitem secondary_load;
alter table nation secondary_load;
alter table orders secondary_load;
alter table part secondary_load;
alter table partsupp secondary_load;
alter table region secondary_load;
alter table supplier secondary_load;

这个过程需要一定时间,请耐心等待。

5.5 执行 TPC-H 测试

参考GreatSQL社区提供的TPC-H性能测试脚本,完成测试,并记录各个SQL的耗时。

该测试脚本大概工作模式如下:

  1. 先执行22个查询SQL,进行数据预热,每条SQL各执行2次。

  2. 再分别执行22个查询SQL,每个SQL各执行3次。

  3. 每次执行SQL都会记录其起止时间,及其耗时,如下面例所示:

[2023-09-27 01:38:45] BEGIN RUN TPC-H Q1 1 times
[2023-09-27 01:38:46] TPC-H Q1 END, COST: 1.301s


[2023-09-27 01:38:46] BEGIN RUN TPC-H Q1 2 times
[2023-09-27 01:38:47] TPC-H Q1 END, COST: 0.787s

上述结果中的 COST: 1.301s ,即为本SQL的运行耗时:1.301秒。

完整性能测试报告:https://greatsql.cn/docs/8032-25/user-manual/10-optimze/3-3-benchmark-greatsql-tpch-report.html


Enjoy GreatSQL :)

关于 GreatSQL

GreatSQL是适用于金融级应用的国内自主开源数据库,具备高性能、高可靠、高易用性、高安全等多个核心特性,可以作为MySQL或Percona Server的可选替换,用于线上生产环境,且完全免费并兼容MySQL或Percona Server。

相关链接: GreatSQL社区 Gitee GitHub Bilibili

GreatSQL社区:

image

社区有奖建议反馈: https://greatsql.cn/thread-54-1-1.html

社区博客有奖征稿详情: https://greatsql.cn/thread-100-1-1.html

(对文章有疑问或者有独到见解都可以去社区官网提出或分享哦~)

技术交流群:

微信&QQ群:

QQ群:533341697

微信群:添加GreatSQL社区助手(微信号:wanlidbc )好友,待社区助手拉您进群。

内容概要:本文系统研究了基于粒子群算法(PSO)的电动汽车充电动态优化策略,并提供了完整的Matlab代码实现。研究聚焦于通过智能优化算法实现电动汽车充电过程的动态调度,旨在提升充电效率、降低电网负荷峰值、促进可再生能源消纳,并实现能源的高效与低碳分配。文中详细阐述了优化模型的构建过程,包括多目标函数设计(如最小化充电成本、电网负荷波动和用户等待时间)、约束条件设定(如充电功率限制、电池容量、用户出行需求等),以及粒子群算法的具体实现流程。通过仿真实验验证了该策略在不同场景下的有效性与鲁棒性,展示了其在削峰填谷、降低用电成本和提升用户体验方面的显著优势。该研究是智能优化算法在智慧交通与新型电力系统融合领域的重要应用。; 适合人群:具备一定Matlab编程能力和优化算法基础知识,从事电力系统规划、新能源汽车管理、智能交通、能源互联网等方向的科研人员、工程技术人员及高校研究生。; 使用场景及目标:①应用于城市电动汽车有序充电管理平台与智能小区能源管理系统;②为微电网和配电网中的电动汽车集群提供科学的调度决策支持;③帮助研究人员深入理解并掌握粒子群算法在复杂多目标动态优化问题中的建模、求解与仿真分析方法。; 阅读建议:建议读者结合所提供的Matlab代码进行动手实践,重点分析目标函数的权重设置、算法关键参数(如惯性因子、学习因子)对优化结果的影响,并尝试将模型拓展至考虑更多不确定性因素(如用户行为随机性、可再生能源出力波动)的场景,以深化对智能优化调度策略的理解与应用能力。
内容概要:本文围绕“覆盖和覆盖D2D通信网络的传输容量分析”的Matlab代码实现展开,重点研究设备到设备(D2D)通信在蜂窝网络覆盖下的传输容量特性。通过建立合理的通信系统模型,对频谱效率、干扰管理、资源分配等关键因素进行建模与仿真,利用Matlab工具量化评估D2D通信网络在不同场景下的传输容量表现。文档虽混杂多个研究主题,但核心聚焦于D2D通信系统的性能分析,涵盖信道建模、功率控制、干扰抑制及容量计算等关键技术环节,旨在为相关通信系统设计与优化提供仿真依据和技术支持。; 适合人群:具备通信工程、电子信息或相关专业背景,熟悉Matlab编程语言,掌握无线通信基本理论(如干扰、频谱效率、链路预算等)的研究生、科研人员或通信领域工程师。; 使用场景及目标:① 研究D2D通信与蜂窝网络的共存机制及其相互干扰影响;② 仿真对比不同资源复用策略或功率控制算法对D2D网络传输容量的提升效果;③ 支持学术论文撰写、科研项目验证或课程设计中对D2D通信系统性能的定量分析与优化。; 阅读建议:建议结合现代无线通信原理与网络容量理论进行深入学习,重点关注代码中的用户分布模型、信道增益计算、干扰建模及容量公式实现部分,可通过调整网络密度、发射功率、频谱复用方式等参数进行多组对照实验,以全面理解系统性能变化规律。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值