rustdx

pytdx 启发的 A 股数据获取工具,包含: 1. 一个 Rust 通用库; 2. 一个命令行工具。

命令行工具(统计数据基于笔者的单核 CPU Ubuntu 系统 release build,以实际速度为准): 1. 解析所有最新股票列表的历史 A 股数据(包含复权数据)不到 30s ,解析后的 csv 大小 1G 多; 2. 子命令直接将解析后的 csv 数据插入到 ClickHouse (20s,表 268 M) 或 MongoDB (7 分钟,表超过 700 M); 3. 东财日线增量更新(包括复权),2s 更新完。

关于复权: 1. 使用涨跌幅复权算法,无需修改(重算)历史复权信息; 2. 只计算收盘价前复权,其他价格复权只需基于收盘价和相对价格即可计算出来(这在 ClickHouse 中很快)。

具体文档待补充。

rustdx-cmd

安装方式

  1. cargo install:

shell CARGO_PROFILE_RELEASE_LTO=true CARGO_PROFILE_RELEASE_OPT_LEVEL=3 cargo install rustdx-cmd

子命令

完整使用例子

准备好 day 文件、gbbq 文件和 ClickHouse 数据库:

```shell

解析所有最新股票的历史日线数据,且计算复权数据

$ time ../target/debug/rustdx day /vdb/tmp/tdx/sh/ /vdb/tmp/tdx/sz/ -l official -g ../assets/gbbq

写入 ClickHouse 数据库

$ time clickhouse-client --query "INSERT INTO rustdx.factor FORMAT CSVWithNames" < stocks.csv

有了历史日线数据之后,每个交易日收盘之后,更新当天数据

$ time rustdx east -p factor.csv $ time clickhouse-client --query "INSERT INTO rustdx.factor FORMAT CSVWithNames" < eastmoney.csv ```

其中 factor.csv 来自数据库中,前一天的复权数据,ClickHouse 的导出命令: sql WITH ( SELECT max(date) AS date FROM rustdx.factor ) AS latest SELECT date, code, close, factor FROM rustdx.factor WHERE latest = date INTO OUTFILE 'factor.csv' FORMAT CSVWithNames;