Google 日本語入力!

昼休みにカレーパンを食べながらmixiでサンシャイン牧場をやり、悪戯をしてさて、帰ろうかと思ったところで、珍しくテリー氏の良い話とかその辺のトピックを読んでいたら「Google日本語入力」と。

GoogleIME!

Googleはサジェスト機能だとかとにかく高度な数学的な考えのもと、最適なものを出してくれるのだろう。

(他の日本語入力システムは日本語を日本語(高度な文学というか)として分析解析予測などしている)
※Google日本語入力が実際どう動いているかはまだ知らないので推測というか思い込み

Googleの主張によると:

Web から機械的・自動的に辞書を生成することで、人手ではカバーしきれないような、新語、専門用語、芸能人の名前などを網羅的に収録しています。高い変換精度を実現するために、Web 上の大量のデータから統計的言語モデルを構築し、変換エンジンを構成しています。

現在の Web のありのままを反映したインプットメソッドと言えます (この辞書および統計的言語モデルの作成は Google の大規模分散処理システム MapReduce を用いて、数千台規模の計算機クラスタを使って行っています)。さらに、強力なサジェスト機能によりこれらの大量の単語を少ないキー数で入力することが出来ます。

スポンサードリンク

これまでのIME

FEPといえばジャストシステムやマイクロソフトがよく使われる。
現在のワードプロセッサソフトウェアはマイクロソフトのWordが大きなシェアを占めているが、過去にジャストシステム社のワードプロセッサソフトウェア「一太郎(いちたろう)」がシェアを占有していたときには、付属のatok(えいとっく;アルファベット(A)から(To)漢字(K)へという意)が圧倒的なシェアをしめていた。

ワードプロセッサは、文章の体裁をコントロールするソフトウェア。簡単に言うと見栄え。対してIMEは入力変換支援。入力された文字を適切な漢字などに変換できるように候補を出す。そして決定すると、それがワードプロセッサソフトウェアへ送られ、体裁を整えられて表示、保存、印刷される。

つまり、ワードプロセッサとIMEは切っても切れない関係にあるわけだけど、組み合わせを好みに応じて変更することは容易にできる。例えばマイクロソフト製品の組み合わせだとWordとWindowsIMEなどが最適な組み合わせで、最高のパフォーマンスと結果を得ることができるように設計されている。しかし、それぞれは独立したソフトウェアなので、Wordとatokを組み合わせて使うこともできる。

新しいものへの流れに乗ることができるかどうかの決断が難しかった

シェアの逆転が起きたからだ。これまでAtokで培ってきた操作とマイクロソフトのIMEでは異なったのだ。記憶に残っていることでは下ボタンを押したときにマイクロソフトは変換候補が出るのに対してAtokでは文節確定だったように記憶している。また、表示される色なども異なり、今までと違うようになることに多少抵抗した。

だが、なんとなくこれからはこの流れになるのだろうと予感した。メーカーからは一太郎も出るとWordモデルが別々にでていたが、やがてWordモデルが主流になった。この時代はまだ学生でこれほど(コンピュータに対しての興味はあったがそれ以上の)詳しくなかったため、背景的なものの実際はわからないが、ジャストシステムが一太郎、花子、三四郎などを出す一方、マイクロソフト社はOfficeとしてWord、Excel、IME(やがてOutlookも含まれ、一時はInternetExplorerも含まれた)を出し、わかりやすくしたのではないかと考えている。

実際、一太郎は最もよく見かけたが、花子に触れることは少なかった。それ以上に三四郎に触れることはとても少なかった。表計算ソフトウェアとしては、LotusからLotus1-2-3(ろーたすわんつーすりー)が出ていて、こちらのシェアがとても高く検定試験もこれに沿って行われていた。わかりやすくまとめ、連携させ、また機能面では追いつき追い越しの勢いでシェア争いに勝ったのではないだろうか。当時を懐かしむと、これらを動作させるためには非常にマニアックな操作が必要だった。また、しばしばシェア争いでは黒いうわさもちらほら囁かれるがここでは触れないことにしよう。

ジャストシステムは今でも革新的な技術向上をみせ、精度の高い変換候補表示や、特定の分野に長けた製品を出し続けるなど熱烈な支持をえている。また、Linuxへの提供や携帯端末への提供なども精力的に行い、知らぬ間におよそこの2つを今でも場面ごとに使っているのだろう。

 IMEGoogleがIMEを作成した理由と影響、そして懸念

長い歴史を持ち、進化してきたIMEになぜ手を出す必要があったのだろうか。

Gooleの一般的な収入源は広告だ。だがIMEには広告は無い。Googleは常に大きな挑戦をし、驚かせてくれる企業だが、それ以上にいま挑戦しているのがOSの開発だ。現在Andoroidが携帯端末向けに、chromeOSがネットブック向けに開発されている。これが将来統合されひとつになるのではないかという予測する記事も見かけて、それとなく納得させられた。つまり、携帯端末でもネットブックでもあらゆる端末で動作するOSを目指しているのではないだろうか。これらは無償提供されることから一定の実績が作られた後は爆発的に増える可能性を秘めていると思われる。ここでも無料だ。

Googleは次々いままで喉から手が出るほど欲しくても価格ゆえ入手することができなかったもの(衛星写真など)も次々無料で出してくる。そして、組み合わせる。彼らの理念でもあり非常に優秀な検索技術をつかい、これまで蓄積した字のごとく膨大な情報とマッチさせていく。そうやって利用者を増やしどこかの隙間に効果的な広告を置くことでユーザにも広告主にも最適な、そしてGoogleにとっても効果の高い収益を生み出すことができる。Googleの検索技術は非常に優秀で、優秀すぎて(ハッキングしているのは無いかなど)恐れられるほどだ。

ところで、英語圏以外のユーザにとって利用する際問題になるのは日本語入力だ。Linuxでも日本語入力ソフトウェアはいくつもある。そこにAtokが入ったことで事情は変わりつつある。これまでマイクロソフトやジャストシステムはそれぞれの分野において支持を伸ばしてきたが、そのどちらにも影響を与えそうなIME。これは単に精度の高いIMEを出すことよりもOSのIMEとして人柱的なものなのではないかとされている。

またGoogleはとにかく全ての情報を記録する。私は皮肉と恐れをこめて「彼らは情報を消すことを知らないのではないか?」と表現することがある。それほど本当に膨大な情報を蓄積する。ノウハウや経験と同じく、情報の蓄積は既にそれ自体に価値がある。そして彼らはそれを他の誰にも負けない技術と視点でそれらを上手に活用することができる。Googleの提供するサービスはとても魅力的でついつい利用してしまう。そしてもう手放せなくなるのだ。その間に蓄積されたデータは恐ろしい。つまり、趣味思考や行動などが記録され、行動に分析する技術を持っているものに預けなければならないのだ。それがわかっていても、利用せざるを得ないサービスを提供し続けることはすばらしくもある。

そういった事情を知るユーザからは、自然に入力文字が送信されるのではないか、蓄積されるのではないか、キーロガー(入力した文字やパスワードを抜き取るハッキング技術の一つ)と何が違うのか?という疑問も議論されている。これについてGoogleはそういったことは一切無いと主張している。これはあらゆるところであらゆる情報が蓄積分析されるその意味を知っている人間だからこそ疑ってしまうとものだ。

Googleはひとつの国になるのか?それとも地球をハッキングするのか?

上記のような文句は参考サイトにもあったし、Googleについて興味を持っている人間なら常に思わざるを得ないことだ。

Googleはクラウドコンピューティグを推進している。またその為に目玉が飛び出るくらいでは驚きが伝わらないほどの驚くべき投資やをし、そして技術をもっている。クラウドコンピューティングは地球上のどこに居てもどのコンピュータからでもインターネットを通して常に情報がやりとりできることを意味している。パソコンを買い換えたりした場合、データの引越しが大変だが、これらがクラウドコンピューティングでは必要ない。必要とするのは自分を証明するためのIDとパスワードだけだ。

ユビキタス社会が目前に迫っている。

そんな地球全土に影響のある一企業。彼らは天才的な数学ができ、物事の考え方が普通ではない人たちだ。最も特徴的で少なくとも日本で知られている彼らは、子どものように陽気にカラフルな玩具で遊び、おもちゃを仕事中も身近に置き、会社の中をサイクリングする。

こんなことしてみないか?と仲間に問い合わせ、賛成がいくつか得られればすぐにプロジェクトになる。そうやって生まれてきたものの中にGmailも含まれていた気がする。ただ、単なるウェブメールならもうある。彼らがコトを起こすには何か面白いことがあるからだ。

できる会社、組織

全ての仕事を100%とするとそのうち20%は自分の仕事をしてはいけない。数少ない束縛のひとつだ。遊ぶもよし、仲間を助けるもよし、なにかしら本来の仕事ではないことをしなければならない。だが、そこから感じて生まれるものはすばらしい。ユニクロや再春館製薬所などユニークなデキル会社のトップの発想や理念はこういったものと似ていると感じる。できる人間を適切に評価し誰にでもチャンスがあり、無理をしない。なにより社員を大切にする。そうすることで、顧客にも満足を与えることができる。すべからく自然に無理なく収益につながり、以って社会貢献となる。

完全管理主義、完全トップダウンの会社ではなかなか真似できないものだが、結果がそれを静かに語る。
そういうやりがいのあるところに行ってみたいものだ。

結論

  • Googleがまた興味深いことを一つ増やした
  • 入力されたものはGoogleに送信されないとGoogleは主張している
  • ジャストシステムやマイクロソフトなどに与える影響を心配する声も聞こえる
  • 新語には強い、特に人名に強い
  • これまで排除されてきた言葉(一般的に良くないとされる表現)も含まれる
  • 現在のところダウンロードが非常に重い=期待の高さをうかがわせる
  • これまで期待に反した変換に悩まされてきた多くのユーザは期待している
  • 高精度で無料ということでも注目されている
  • 何もかもがGoogleになっていくことへの懸念
  • chromeOSのための人柱
  • 既に人柱になったユーザが興奮する変換精度

余談

♪今宵、月が見えずとも / ポルノグラフィティ偶然Yahoo!サウンドステーションを聞いていたらこれがかかった。「グーグル検索で~」という歌詞が盛り込まれている。すごい・・・。一企業の社名が入った歌(広告じゃなくて;これはアニソンだった気がする)ってこれまであっただろうか?記憶の中には見当たらない。

◆ダウンロード

Windows XP SP2 以上(32bit)とMACに対応、残念ながらLinuxはないようだ。

Google 日本語入力
思いどおりの日本語入力。Google 日本語入力は、変換の煩わしさを感じさせない思いどおりの日本語入力を提供します。

◆参考文献

コメント