feature image

2023年9月7日 | ブログ記事

最強のIMEはどれだ

この記事はtraP 夏のブログリレー 18日目の記事です。

我々はチャットからレポートに至るまで毎日様々な文章を書いています。日本語の文章を作成するとき、ほとんどの人は何らかのIMEを用いていると思います。言うまでもなく、IMEの性能は文章作成の生産性に直結します。

加えて言えば、このブログをご覧になられている方の中には紙に文字を書くよりもキーボードでタイプして入力する方が速いという方も多いと思います。思考を整理する際にも、紙とペンを使うよりもタイピングを選ぶ人も多いでしょう。

そのような人にとって、IMEは単にアウトプットの速度を向上させるだけでなく、思考の速度や質をも左右する重要なファクターとなっています。

この記事では、WindowsにおけるメジャーなIMEである Microsoft IME、Google 日本語入力、ATOKの3つについて、その性能を比較し、「最強のIME」が何であるかについて考察します。

比較の内容

僕はこの記事を執筆するに当たって、僕が先日執筆したcatch-allのススメ(2259文字)を入力し、その変換の精度について調べることにしました。

条件をそろえるために、いくつかの工夫を行いました。まず、変換履歴やその他の学習の影響を防ぐため、比較は仮想環境下に新規インストールしたWindows 10上で行いました。

また、変換するタイミングや誤入力が変換に影響を与えることを防ぐために、別の端末に入力した一連のキー操作をHiMacroExを用いて再現し、各IMEに可能な限り同じ入力を与えました。

結果

正直2259文字もあればそこそこミスが出るのでは無いかと思っていたのですが、どのIMEも想定よりかなり良い結果が得られたため、ミスが少なすぎて比較にはデータが不十分との結論に至りました。

(本当は比較記事を名乗るならば十分なデータを集めるべきですが、一連のキー操作を記録してからの比較は、通常の文章入力よりも非常に時間がかかるため今回は断念しました。)

Microsoft IME

結果: 2ミス

実はあまり期待していなかったのですが、思いの外精度が良かったです。予測変換に難があるものの、近年はクラウド予測変換の実装などによりかなり実用的になってきていると感じます。

また、全体的にひらがなのまま残す変換が多いように感じました。

Google 日本語入力

結果:3ミス

流行語に強いなどの特徴があるとされているGoogle日本語入力ですが、今回の比較では奇妙な変換が目立ちました。

また、ミスとしては数えなかったのですが「どこかしら」を「何処かしら」と変換したかと思えば「伝えれば」を「つたえれば」のままにするなど、変換するかどうかの基準が一貫していないように感じました。

ATOK

結果:1ミス

有料ソフトということもあって、変換精度は高かったです。ただ、まだ改善の余地はあるように感じました。

ミスの例

以上の比較で1つ以上のIMEが間違えた箇所を具体的に紹介します。比較のときには試しませんでしたが、参考として、macOSの標準IMEと「かわせみ3」で変換を試した結果も掲載します。

原文 メールアドレスを無限個持つ方法
Microsoft IME メールアドレスを無限子持つ方法
Google 日本語入力 メールアドレスを無限こ持つ方法
ATOK メールアドレスを無限個持つ方法
macOSの標準IME メールアドレスを無限個持つ方法
かわせみ3 メールアドレスを無限子持つ方法

Microsoft IME(とかわせみ3)は明確に間違えています。Google日本語入力も誤変換と言えるでしょう。

原文 Cloudflareで取ったドメイン
Microsoft IME Cloudflareで撮ったドメイン
Google 日本語入力 Cloudflareで取ったドメイン
ATOK Cloudflareで取ったドメイン
macOSの標準IME Cloudflareで撮ったドメイン
かわせみ3 Cloudflareでとったドメイン

これもMicrosoft IME(とmacOSの標準IME)が明確に間違えています。(かわせみ3はひらがなに逃げました)

原文 維持に年間3000円
Microsoft IME 維持に年間3000円
Google 日本語入力 維持二年間3000円
ATOK 維持に年間3000円
macOSの標準IME 維持二年間3000円
かわせみ3 維持に年間3000円

Google日本語入力(とmacOSの標準IME)だけ文節の区切りを間違えています。

原文 「admin@なんちゃら」にメールを送ってくる
Microsoft IME 「admin@なんちゃら」にメールを送ってくる
Google 日本語入力 「admin@なんちゃら」二メールを送ってくる
ATOK 「admin@なんちゃら」にメールを送ってくる
macOSの標準IME 「admin@なんちゃら」にメールを送ってくる
かわせみ3 「admin@なんちゃら」にメールを送ってくる

元の日本語がおかしい気もしますが、Google日本語入力だけ誤変換です。

原文 hoge+anystring@gmail.com宛のメール
Microsoft IME hoge+anystring@gmail.comあてのメール
Google 日本語入力 hoge+anystring@gmail.comあてのメール
ATOK hoge+anystring@gmail.com当てのメール
macOSの標準IME hoge+anystring@gmail.com宛のメール
かわせみ3 hoge+anystring@gmail.com当てのメール

直前がIMEが無視する半角文字だったことを考えれば仕方がない気もしますが、ATOK(とかわせみ3)は誤変換です。

最強のIMEはどれだ

最後に、各IMEの特徴を、実際の使用経験を元に述べたいと思います。

Microsoft IME

ここ数年でMicrosoft IME自体も進歩してきており、変換精度は一昔前とは比べ物にならないほど進化してきました。通常の変換においては十分に実用的な精度で変換できると感じています。

その一方で、予測変換はまだまだ弱い面があると感じています。クラウド予測変換などにより十分に実用的なレベルになってきてはいるものの、さらなる改善の余地があると言えるでしょう。

Google 日本語入力

Google日本語入力は流行語や固有名詞に強いとされています。実際、これらの変換やサジェストは非常に強力です。しかし、変換精度それ自体は必ずしも高いとは言えません。

「もしかして変換」「計算機能」「郵便番号変換」や、「zlで右矢印(→)が出せる」などのミニ機能も非常に使いやすく、一度使うと離れられなくなります。

せっかくなので、「z+英小文字で記号が出せる」に慣れてしまい本当に離れられなくなったときの対処法を説明します。Google日本語入力同様ローマ字テーブルを修正することを考える方が多いと思いますが、ATOKはローマ字テーブルの「かな」にひらがな以外を受け付けませんしMicrosoft IMEはそもそもローマ字テーブルの変更が出来ません。ワンステップ増える(zlを入力した後に変換を確定させる必要がある)ので面倒ですが、「zl」を読み、「→」を変換先とした単語を辞書に追加するのが一番楽だと思います。

ATOK

有償ソフトなだけあって変換精度は群を抜いて高いです。強力な学習/サジェスト機能は流行語から専門用語まで幅広く対応しており、非常に使いやすいです。

個人的に最も気に入っているのはタイプミスの自動修正です。軽微なうち飛ばしや順番間違いがあった場合も適切に修正して変換してくれます。僕はタイプミスが多いので、この機能に大きく助けられています。

また、「学習履歴の同期」「タイプミスの傾向などが分かるマンスリーレポート」などの周辺ツールも非常に便利です。

その一方で、いくつかの欠点があります。

設定項目が複雑で導入にはそれなりの手間がかかる

ATOKの設定の自由度は非常に高いです。Google日本語入力もそれなりに設定の自由度が高いですが、ATOKの設定項目は群を抜いて多いです。

この欠点を解消するために自動設定ウィザードが用意されていますが、これにより自動で設定される項目はそれほど多くないです。

もちろんデフォルトでもある程度使いやすいので、面倒な方は設定せず使うのも手だと思います。

デフォルトのキーコンフィグに慣れるのには時間がかかる

ATOKのデフォルトのキーコンフィグはMicrosoft IMEのそれとは異なっています。(次の変換候補に移動するときには下矢印キーを使用します)

もちろんMicrosoft IMEのデフォルトと同様に設定することも出来ますが、このキーコンフィグのほうが文節区切り位置を容易に変更することが出来るなど機能的でATOKに向いていると言えるでしょう。他のIMEもATOK風のキーコンフィグにできることが多いので、ATOKのデフォルトのキーコンフィグに慣れることも検討すべきだと思います。

大型のユーザー辞書を使用していると同期に失敗する

僕はWebで公開されている「ニコニコ大百科変換辞書」(約20MB)を導入しています。ATOKが提供する保存領域は50MBですが、この辞書を入れたまま同期を実行すると容量不足でエラーが起きました(おそらく、辞書本体のサイズよりも格納すべきサイズが大きいのだと思います)

僕はこの問題を回避するため、同期対象からユーザー作成辞書のデータを除外しています。ただ辞書を追加・削除したときにいちいち手動で他の端末でも追加・削除する必要があるので面倒ではあります。

それなりに変換ミスが起こる

変換ミスはそれなりの頻度で発生します。他のIMEと比べると比較的精度は高いものの、変換ミスが0にならないのはもちろん、劇的に精度が向上することもありません。単に変換精度が向上することだけを狙いとしてATOKに課金することは正直オススメ出来ません。

まとめ

どのIMEにも長所と短所があり、どのIMEが使いやすいと感じるかは人によって異なります。Google日本語入力は無料で使えますし、ATOKは30日無料でお試しできるので、是非使い比べて自分に合った最強のIMEを見つけてみてください。

明日の担当は@pirosikiさんです。お楽しみに!

ramdos icon
この記事を書いた人
ramdos

23B。CTFをしている場合とそうでない場合があります。

この記事をシェア

このエントリーをはてなブックマークに追加
共有

関連する記事

2021年8月12日
CPCTFを支えたWebshell
mazrean icon mazrean
2022年9月26日
競プロしかシラン人間が web アプリ QK Judge を作った話
tqk icon tqk
2022年9月16日
5日でゲームを作った #tararira
Komichi icon Komichi
2023年9月27日
夏のブログリレーは終わらない【駄文】
Komichi icon Komichi
2023年9月13日
ブログリレーを支えるリマインダー
H1rono_K icon H1rono_K
2023年8月21日
名取さなになりたくてOBSと連携する配信画面を作った
d_etteiu8383 icon d_etteiu8383
記事一覧 タグ一覧 Google アナリティクスについて 特定商取引法に基づく表記