あれこれ備忘録@はてなブログ

勉強したことやニュースや出来事を備忘録として書いていきます

(追記あり)Androidの日本語入力アプリにGoogle日本語強化辞書を登録した

その辞書の在り処は各自で探して下さい。

以前はGoogle日本語入力が重く、Simejiを使っていたのですが、入力情報無断送信の一件で別の入力アプリに乗換えました。

長らくそれを使っていましたが、Google日本語入力やSimejiに比べると変換能力が弱いため、長文は打てませんし、きちんと目的の単語に変換してくれないことも良くあります。

長文の変換は諦めるとしてもせめて単語くらいは変換候補から選べる様にしたいと思い、辞書を登録してみました。

使っているアプリでは辞書のインポートができるものの、「読み(全角スペースなどの区切り)漢字」のようになっています。

一方、メジャーな日本語入力アプリやPCの日本語変換ソフトの多くが先ほどのデータ要素に品詞を加えたものになっているようです。

今回、登録した辞書も同様だったので、ちょっと困りました。

調べてみたところ、オンラインの変換ツールがありましたが、Androidからだと上手く動きませんでした。

FirefoxでもOperaでも駄目だったので諦めました。

そこで思い付いたのはtxt形式の辞書ファイルを表計算ソフトで読み込んで品詞の列を削除しようというものです。

結構、誰でも思い付きますね。

しかし、スマホタブレットでやろうとするのは意外に大変でした。

テキストをオフィスアプリの表計算にインポートできなかったのです。

色々試してみて、拡張子csvに書き換えるととりあえず表計算アプリで開けるようにはなりました。

しかし、アプリによってcsvのフォーマットがカンマ区切りで固定されていてスペース区切りでは行列の要素に分けてくれないなどなかなか一筋縄ではいきません。

以前、紹介したAndroOpenOfficeでなら区切り文字を指定して読み込む事ができました。

PCのユーザーインターフェースをそのまま移植しているので指定の仕方はさほど迷いませんでしたが、如何せん無理にPCの画面を再現しているので、狭い画面をマウスやキーボードをエミュレートする機能で上手く操作しなくてはならず、一苦労でした。

何とか登録はできたのですができたのですが、どうも完璧では無かったらしく、妙な重複があったり、変換後の語句の後ろに無駄な全角スペースがあったりとなかなか困った状況です。

30000語近くあるものを地道に修正するのは大変なので、使いながら変な結果が出たときに編集、削除の修正をしたいと思います。

人名や地名がすぐに変換できるようにはなっているはずですから、それで良しとします。

ATOKやMS IMEの辞書ならもう少し楽でしょう。

そして、素直にPCで変換作業したあと、そのファイルを端末に持ってくるほうがいいでしょうね。

追記

やっぱり上手くいってませんでした。

ほとんどのファイルが語句の最後に全角スペースを持っているという酷いことになっておりそのせいでほとんどの変換がおかしくなっていました。

もとのテキストファイルから行末のカンマやスペースといった区切り文字を正規表現で削除したり、読み込み時の区切り記号の正規表現も変えてみましたが、上手くいかず。

そのアプリは辞書のバックアップがとれるのですが、何故かそのファイルはテキストファイルではなく拡張子dicという別物。

中身がSQLite形式のデータベースファイルだったため、SQLiteを編集するアプリを入れてSQL文を書いて何とかできました。

インターネットが無かったら、それも今ほど情報が豊富でなかったらお手上げですね。

便利になりました。

情報を書いて下さっている方々に感謝します。

疲れたのでこれで少し様子見です。

さらに追記

登録した語句の数が多すぎるようなので表計算ソフトで久しぶりにフィルタを使いながら削り作業中…