Pure Rust port of the Igo, a POS(Part-Of-Speech) tagger for Japanese.
The original version was written in Java.
Japanese follows the English
```shell % cp -r somewhere/originaljavaigo/dic/ipadic data % cargo build --release % ./target/release/igo -t "すもももももももものうち" data/ipadic
すもも 名詞,一般,,,,,すもも,スモモ,スモモ も 助詞,係助詞,,,,,も,モ,モ もも 名詞,一般,,,,,もも,モモ,モモ も 助詞,係助詞,,,,,も,モ,モ もも 名詞,一般,,,,,もも,モモ,モモ の 助詞,連体化,,,,,の,ノ,ノ うち 名詞,非自立,副詞可能,,,*,うち,ウチ,ウチ EOS ```
```rust extern crate igo;
use std::path::PathBuf; use igo::Tagger;
fn main() { let dicdir = PathBuf::from("data/ipadic"); let tagger = Tagger::new(&dicdir).unwrap(); let text = "すもももももももものうち";
let results = tagger.parse(text);
for ref m in results {
println!("{}\t{}", m.surface, m.feature);
}
println!("EOS");
} ```
The MIT License.
Takeru Ohta氏がJavaで書いた日本語形態素解析ライブラリ Igo をRustに移植したものです。
コマンドラインプログラムとして、またはライブラリとして使用可能です。 上の Demo と Usage を見てください。
igo::Morpheme
は 処理対象テキストと igo::Tagger
への参照を保持しています。 surface
は処理対象テキストのスライスであり、
feature
は辞書内テキストのスライスです。
必要に応じて surface.to_string()
等の処理をしてください。