使用Qlib 进行数据处理工作流程的示例:
- 用户下载数据并将数据转换为Qlib格式(文件名后缀为.bin)。在此步骤中,通常仅将一些基本数据存储在磁盘上(例如OHLCV)。O (Open):开盘价,即该交易日内第一笔成交的价格。
H (High):最高价,该交易日内成交价格的最高点。
L (Low):最低价,该交易日内成交价格的最低点。
C (Close):收盘价,即该交易日内最后一笔成交的价格。
V (Volume):成交量,该交易日内所有成交的数量总和。 - 基于Qlib的表达式引擎创建一些基本功能(例如“Ref($close, 60) / $close”,最近60个交易日的回报)。可以在此链接找到表达式引擎中支持的运算符。此步骤通常在 Qlib 的Data Loader中实现,它是Data Handler的一个组件。
- 如果用户需要更复杂的数据处理(例如数据标准化), Data Handler支持用户定制的处理器来处理数据(一些预定义的处理器可以在这里找到)。处理器与表达式引擎中的运算符不同。它是针对一些复杂的数据处理方法而设计的,这些方法在表达式引擎的运算符中很难支持。
- 最后,Dataset负责从 Data Handler 处理后的数据中准备模型特定的数据集
数据准备
Qlib专门设计了一个数据结构来管理财务数据,详细信息请参考Qlib论文中的文件存储设计部分。此类数据将以文件名后缀.bin存储(我们将它们称为.bin文件、.bin格式或 qlib 格式)。.bin文件专为金融数据的科学计算而设计。

Alpha360 和 Alpha158 是两套生成交易信号或特征的系统。在量化交易中,这些"Alpha"系统用于捕捉能够预测股票价格变动的模式。
Alpha360 可能包含360个不同的特征,覆盖多种市场情况和交易数据,用来构建全面的交易模型。
Alpha158 则包含158个特征,可能侧重于特定类型的市场数据或技术指标。
此外,Qlib还提供了高频数据集。用户可以通过此链接运行高频数据集示例。
Qlib格式数据集
Qlib提供了现成的.bin格式的数据集,用户可以使用脚本scripts/get_data.py下载China-Stock数据集,如下所示。用户还可以使用 numpy 加载.bin文件来验证数据。成交量数据看起来与实际成交价格有所不同,因为它们经过了调整(调整后的价格)。然后你可能会发现,不同的数据源调整后的价格可能会有所不同。这是因为不同的数据源调整价格的方式可能会有所不同。 Qlib在调整时将每只股票的第一个交易日价格归一化为1。用户可以利用 f a c t o r 得到原始交易价格(例如 factor 得到原始交易价格(例如 factor得到原始交易价格(例如close / $factor得到原始收盘价)。
以下是关于Qlib价格调整的一些讨论:
讨论区
# download 1d
python scripts

本文介绍了使用Qlib进行数据处理的工作流程,包括将数据转换为Qlib格式、基于表达式引擎创建功能、定制处理器处理复杂数据等。还提及Qlib提供的数据集,如Alpha360和Alpha158系统,以及数据更新、格式转换等操作,同时介绍了股票池和不同股票模式的使用。
--数据准备&spm=1001.2101.3001.5002&articleId=138380776&d=1&t=3&u=49efd54b3f5d4e188208744997cd3e14)
5230

被折叠的 条评论
为什么被折叠?



