chanoma

chanoma is Characters Normalization library. 文字列正規化処理用のライブラリです。

使い方

for CLI

sh chanoma -p ハンカクカナ

for Rust

```rust use chanoma::Chanoma;

fn main() { let chanoma = Chanoma::new(); chanoma.use_preset(); println!("{}", chanoma.normalize("ハンカクカナ")); } ```

インストール

for CLI

sh cargo install --git https://github.com/booink/chanoma

for Rust

toml:Cargo.toml [dependencies] chanoma = { version = "0.1.0", git = "https://github.com/booink/chanoma" }

設定ファイル

chanoma は設定ファイルを配置することで、結果を調整することが可能です。 設定ファイルを読み込ませるための方法は二種類あります。

上記のどちらの場合でも、.{ext} に指定可能な拡張子は .csv, .yaml (.yml) のどれかです。

CSV ファイルの場合のフォーマット

CSV ファイルでは、一文字から一文字の置換のみ設定が可能です。 最初の列に 置換したい文字、次の列に 置換後の文字 を記述します。

csv from,to &,&

YAML ファイルの場合のフォーマット

Yaml ファイルでは、一文字から一文字の置換と、Modifier を指定する二種類の方法があります。

一文字から一文字の置換

ルートキーに items を記述し、配列指定で from キーの値に 置換したい文字to キーの値に 置換後の文字 を記述します。

yaml items: - from: "a" to: "A"

Modifier を指定する

ルートキーに modifiers を記述し、一段インデントして Modifier をキーとして記述します。 指定できる Modifire は以下です。

yaml modifiers: character_converter: a: A b: B character_eliminator: ["~", ∼, ∾, 〜, 〰, ~] consecutive_character_reducer: ー dotted_space_eliminator: ligature_translator: ハ゜: パ trim: neologdn: