読者です 読者をやめる 読者になる 読者になる

100万字かなのn-gramデータゲットだぜ

kouyさんデータ提供だけにとどまらず分析方法まで明示していただきありがとうございますm(_ _)m早速使わせていただきます.
100万字日本語かなn-gramデータ : ローマ字入力でもなく、かな入力でもなく

探されているものとは違うような気もするけれど

Googlen-gramデータは分かち書きして得られた1単語を1-gramと数えてるみたいなんですよね.普通1-gramと言ったら1文字のことを指すと思うのですが,そこは場合によって違うのですかね.
贅沢を言えばかな配列に割り当てる場合,単語の覚えやすさと使いやすさからGoogle的な意味のn-gramデータの方が使いやすい気はしますが,それはkouyさんのデータを使って確かめてみようと思います.