Baidu IME情報送信のうち問題だったのは何？ - あれこれ備忘録@はてなブログ

ネットエージェントは、両アプリからSSL暗号通信でインターネットに送信されているデータを解析。ユーザーが設定画面でログ送信をオフにしたり、「クラウド入力」をオフにしていても、変換した文字列や端末名、使用中のアプリ名が、国内にあるサーバに送信されていることが分かったという。

送信されていたのは、Baidu IMEは（1）変換確定文字列、（2）Windows PCのセキュリティ識別子（SID）、（3）使用中しているアプリケーションのパス名、（4）Baidu IMEのバージョン。Simejiは（1）変換確定文字列、（2）UUIDによる個別端末識別子、（3）使用しているデバイス名、（4）使用しているアプリケーションのパッケージ名、（5）Simejiのバージョン。

基本的には、無断で送信、あるいは機能をオフにしていても情報が送信されていたこと、そして入力した日本語情報と直接関係ない情報が送信されていたこと、が問題だったのでしょう。

ネット上のクラウドから高度な変換結果をもらう多くのサービスでは入力した情報を送っています。当たり前ですね。

ひらがなの文字列を送って、それを名詞や助詞、形容詞などなどに分解、解析して正しいと思われる変換結果が返ってくるわけです。

また、変換精度を高めるために、もとのひらがな情報と変換候補のうち何を選んだのかという情報をサーバーに送るということをしていると思います。

「Simeji」の入力ログ無断送信は「実装バグ」　バイドゥ、IMEログ収集の意図を説明

Baidu IMEに関しては「事前に規約を読んでもらっているはず、許可を取ってる」という主張で、Simejiに関しては「オフにしたのに送られていたのはバグ」という見解のようですね。

~~Baidu IMEについてはちょっとひどい言い訳に思えます。~~

追記

ログ情報の送信は設定のプライバシーで変更できました。インストール時にもチェックがあったと思います。無断とまでは言えないようです。

Baidu IME の設定・使い方 - フリーソフト100

さらに追記

プライバシーの項目で設定もできる。 http://blog.livedoor.jp/blackwingcat/archives/1609424.html