Qlib 初始化
初始化
请按照以下步骤初始化 Qlib。
下载并准备数据:执行以下命令以下载股票数据。请注意,数据是从 Yahoo Finance 收集的,数据可能并不完美。如果用户拥有高质量的数据集,我们建议准备自己的数据。有关自定义数据集的更多信息,请参见 数据。
python scripts/get_data.py qlib_data --target_dir ~/.qlib/qlib_data/cn_data --region cn
有关 get_data.py 的更多信息,请参见 数据准备。
在调用其他 API 之前初始化 Qlib:在 Python 中运行以下代码。
import qlib # region in [REG_CN, REG_US] from qlib.constant import REG_CN provider_uri = "~/.qlib/qlib_data/cn_data" # target_dir qlib.init(provider_uri=provider_uri, region=REG_CN)
备注
请勿在 Qlib 的存储库目录中导入 qlib 包,否则可能会出现错误。
参数
除了 provider_uri 和 region,qlib.init 还有其他参数。以下是 qlib.init 的几个重要参数(Qlib 有很多配置。这里只限制部分参数。更详细的设置可以在 这里 找到):
- provider_uri
类型:str。Qlib 数据的 URI。例如,它可以是
get_data.py加载的数据存储的位置。
- region
- 类型:str,可选参数(默认:qlib.constant.REG_CN)。
当前支持:
qlib.constant.REG_US('us') 和qlib.constant.REG_CN('cn')。不同的 region 值将导致不同的股市模式。 -qlib.constant.REG_US:美国股市。 -qlib.constant.REG_CN:中国股市。不同的模式将导致不同的交易限制和成本。区域只是 定义一批配置的快捷方式,包括最小交易订单单位(
trade_unit)、交易限制(limit_threshold)等。这不是必要部分,如果现有的区域设置无法满足用户的要求,用户可以手动设置关键配置。
- redis_host
- 类型:str,可选参数(默认:"127.0.0.1"),redis 的主机
锁和缓存机制依赖于 redis。
- redis_port
类型:int,可选参数(默认:6379),redis 的端口
备注
region 的值应与存储在 provider_uri 中的数据对齐。目前,
scripts/get_data.py仅提供中国股市数据。如果用户想使用美国股市数据,他们应在 provider_uri 中准备自己的美国股票数据并切换到美国股票模式。备注
如果 Qlib 无法通过 redis_host 和 redis_port 连接到 redis,缓存机制将不会被使用!有关详细信息,请参见 缓存。
- exp_manager
类型:dict,可选参数,qlib 中使用的 实验管理器 的设置。用户可以指定一个实验管理器类,以及所有实验的跟踪 URI。但是,请注意,我们仅支持以下样式的字典输入用于 exp_manager。有关 exp_manager 的更多信息,用户可以参考 记录器:实验管理。
# For example, if you want to set your tracking_uri to a <specific folder>, you can initialize qlib below qlib.init(provider_uri=provider_uri, region=REG_CN, exp_manager= { "class": "MLflowExpManager", "module_path": "qlib.workflow.expm", "kwargs": { "uri": "python_execution_path/mlruns", "default_exp_name": "Experiment", } })
- mongo
类型:dict,可选参数,将在一些功能中使用的 MongoDB 的设置,例如 任务管理,具有高性能和集群处理。用户需要按照 安装 中的步骤首先安装 MongoDB,然后通过 URI 访问它。用户可以通过将 "task_url" 设置为类似 "mongodb://%s:%s@%s" % (user, pwd, host + ":" + port) 的字符串来使用凭据访问 mongodb。
# For example, you can initialize qlib below qlib.init(provider_uri=provider_uri, region=REG_CN, mongo={ "task_url": "mongodb://localhost:27017/", # your mongo url "task_db_name": "rolling_db", # the database name of Task Management })
- logging_level
系统的日志级别。
- kernels
在 Qlib 的表达式引擎中计算特征时使用的进程数量。当你调试计算异常的表达式时,将其设置为 1 非常有帮助。