2018年01月04日

実用レベルに達している日本語音声入力


クリエイティブ・コモンズ・ライセンス


画像 (9).png

冒険家の皆さん、今日も鳥カゴの中のオウムに秘密のメッセージを覚えさせていますか?

さて今日は日本語の音声入力について書きたいと思います。

実はこのブログでも2011年に日本語の音声入力について書いたことがあります。今日の記事の最後の参考資料のところにリンクがありますので、ご関心のある方は是非お読みください(ただし2011年の時点での記事だということはお忘れなくお願いします)。この頃は音声入力に出会ったばかりで,それまでのキーボードによる入力に比べてあまりにも速いので非常に感動していました。ただ,実際には文字変換の精度を考えると、まだ実用化できるレベルではなかったように思っています。ですので2回か3回ほど音声入力でブログを書いてみたものの、その後は日常的に音声入力で日本語を書くようにはなりませんでした。

その後、 Twitter でメルボルンに住んでいる@Hatsu_Ozさんがブログを音声入力で書いていることを知りました。この時にも Google ドキュメントで音声入力が使えることを確認しましたが、実際に使ってみると実用化にはもう少し時間が必要であるように感じていました。

また2年ほど前に読んだ「The Miracle Morning for Writers」という本でも音声入力の効率の高さは強調されていましたが、これは英語の本だったので日本語はまだまだ先だろうと思っていました。

先日、ツイッターでも日本語の母語話者に対して音声入力を使っているかアンケートを取ってみましたが、日常的に音声入力を使っているという人は1割もいないという結果になりました。




ところが先日、勝間和代さんのブログで勝間さんが音声入力でブログを書いていることを知って、もう一度 Google ドキュメントで音声入力で長文を書いてみたのです。そうすると、あまりにも変換の精度が高くなっていたので心の底から驚きました。例えば今日のこのブログも音声入力で書いていますが、今のところ一度も誤変換はありません。つまりこの時点で変換精度は100%だということです。もしかしたら、 Google 翻訳で使われているニューラルネットワークの技術の成果なのかもしれません。ねえ Google うるさい (あ、すみません、今のは Google Home に話したものです。 Google Home では「うるさい」と言うとアラームを止めることができるのです。) ちなみに勝間和代さんは音声入力にしてから生産性が3倍向上したとブログに書いています。まるで赤い彗星ですよね。

では、音声入力のメリットとデメリットについてご紹介したいと思います。

【音声入力のメリット】

メリットの一番大きいものは、ちょっと意外かもしれませんが誤変換がなくなるということです。例えば今僕が書いたばかりの文ですが、最初は死亡するという意味の「亡くなる」と言う文字が表示されていました。しかしその後でひらがなだけの「なくなる」という表記に変わりました。これはおそらくGoogleが文脈から自動的に適切な表記を選んでいるからでしょう。しかし、キーボードで入力する時は、漢字変換も全て人間が行いますので、間違った漢字変換がよく起きてしまいます。日本語教育を専門とする僕ですら、長めのブログを読み直してみると漢字の誤変換がひとつもないことはほとんどありません。もしかしたら、正しい漢字を選ぶ能力は一般的な日本語の母語話者よりも Google の方がすでに上回っているのかもしれません。

2番目のメリットとして、音声入力は脳のリソースをキーボード入力ほど使わないということが挙げられそうです。これはもちろん人によって違うと思います。しかし少なくとも僕にとってはキーボードで日本語入力するよりも、このように音声で日本語入力する方が非常に楽です。肉体的に楽なのではなくてメンタルに楽な感じがします。 このために、 ブレインストームのような発想力を同時に必要とするような日本語入力の場合は、特にキーボードよりも音声入力の方が向いているように思います。

3番目のメリットとして、どこでも長文が入力できるということがあります。今までもスマートフォンなどで、どこでも日本語を入力することはできました。しかし、多くの人にとってスマートフォンのフリック入力などでは長文を入力するのはかなり難しいでしょう。したがって喫茶店などで長い文章を書くときはノートパソコンなどを持っていく必要がありました。しかし音声入力ができれば、長文を入力するのも全く問題がありません。例えば出張先などにももうパソコンを持って行かなくてもいいかもしれません。まだやってみたことはないのですが、おそらく風呂場で湯船に浸かりながら長文を書くこともできるのではないかと思います。 僕のように長風呂が好きな人間には大変ありがたい機能です(1月7日追記:実際に音声入力を使って風呂で書いた記事がこちらです)。また参考文献にあげたブログでは、布団の中でブログを書いているという例もあります。僕の場合は一人で寝ているわけではないのでちょっと難しいですが。

4番目のメリットとして、入力にかかる時間が短いということもあげられるかもしれません。ただし、これは僕にとってはそれほど大きなメリットではありません。なぜなら、文章を書くときは入力にかかる時間よりも内容を考える時間の方がずっと長いからです。つまり、キーボード入力よりも音声入力の方が早いからと言って、ブログなどを書く時間が大きく短縮できるというわけではなさそうです。この点については、もしかしたら音声入力にもっと慣れたら変わるのかもしれません。

【音声入力のデメリット】

では次に、音声入力のデメリットについてもいくつか感じたことをご紹介したいと思います。

デメリットの一点目は、キーボードの代わりに喉を使うので今の僕のように時々咳が出てしまう場合はちょっと使いにくいということです。ただ、咳き込んでもそれが意図しない日本語に変換されてしまうわけではありません。咳の部分は単に無視されるだけです。しかし、音声入力をしている途中で咳き込みたくなってしまうと、そこで言葉が途切れてしまうのでうまく入力できません。

2番目のデメリットとして、周りに人がいるとちょっとやりにくいというのがあります。画面を見せているわけでもないのに、自分が何を書いているか伝わってしまうからです。ただし僕の場合は、今までもリビングのテレビにパソコンをつないで、そこでブログを書いたりしていました。ですので、見ようと思えば家族の誰もが僕の書いているブログの内容を見ることができたわけです。そういう点では、僕にとってはあまり抵抗はありません。また僕は海外に住んでいるので、静かな喫茶店で音声入力を使って日本語の文章を書いていても、その内容が分かる人はあまりいません。しかし、日本にいる人の場合はもう少し抵抗を感じるかもしれません。また、同調圧力の高い窮屈な文化で暮らしている人にとっては、音声入力をしていると「周りの迷惑も考えろ」とか言われてしまうこともあるかもしれません。

なお、パソコンに内蔵されているマイクを使う場合は、比較的大きい声で話さないと音声入力ができませんが、イヤホンやヘッドセットにマイクがついているときは、マイクから口の距離が近いので、それほど大きな声でなくても音声入力をすることができます。今日の昼休みに実際にスターバックスに入って iPhone で日本語入力をしてみたのですが、かなり賑やかな BGM がかかっている現場でも正確に音声入力をすることができました。このような賑やかな場所では隣に座っている人の声はあまり聞こえないので、周りの人の耳が気になるようだったら、音声入力は静かなところよりもむしろ賑やかな場所の方が適しているかもしれません。

もうひとつのデメリットとして、 ブレインストームのように思いつきをどんどん入力していくときは大丈夫でも、複雑な構成の長い文章を書くのには向いてないのではないかと思っていたこともあります。これは実際にもう少し長く音声入力を使ってみないとよく分かりませんが、 今日1日の経験だけでも、このブログの記事のようにある程度の構造のある文章を書くことはできることがわかりました。これも、慣れればもっと上手に構成を考えながら音声入力をすることができるのではないかと思います。 またキーボードで入力するときと同じように、音声入力でもマウスで編集する場所をクリックしながらいくらでも入力することができます。ですから最初にアイデアをたくさん出してから少しずつ複雑な構成の文章を作り上げていくということも全く問題なくできますし、一旦書き上げた後でじっくりと文章を推敲することもできます。

今のところ、一番大きなデメリットはおそらく外国語で入力することが難しいということではないかと思います。 Google ドキュメントでは、日本語や英語を始め100ヶ国語ぐらいで音声入力をすることができます。ですから、機能としては色々な言語で入力することができるのですが、 たとえば僕が英語で音声入力しようとすると、日本語に比べると非常に精度が低くなってしまいます。これはもちろん僕の英語の発音に問題があるからだと思います。しかし当たり前ですが、キーボードで入力する時はこのような問題は起きません。 Google の英語の音声入力にはアメリカ、オーストラリア、カナダ、ナイジェリアなど合計で13種類も登録されていますが、残念なことに日本人訛りの英語は選ぶことができません。

ずっと音声で日本語入力をしてみると、固有名詞の文字変換にちょっと問題があることも分かってきました。例えば下で引用しているような経済評論家の野口悠紀雄さんのような場合は、変わった名前でも正しく変換されます。つまり有名人の固有名詞は全く問題ないのですが、家族の名前など、自分だけが頻繁に使う固有名詞は正確に漢字変換してくれません。音声は正しく聞き取っているのですが別の漢字に変換されてしまうことがあるのです。少なくとも Google の日本語音声入力では、キーボードでの日本語入力のように単語登録をする機能がないので、このようなことが起きてしまいます。ただし、近いうちにこの問題は解決されるのではないかと思っています。

また、音声入力できるのは自然言語だけです。ですから、エクセルやGoogle表計算などの関数を入力する時はキーボードを使わないわけにはいきません。プログラミングをする人にとっても、同じように音声入力だけでコードが書けるのは、まだかなり先のことになるでしょう。

もうひとつの大きなデメリットは、パソコンで使う場合はソフトによっては音声入力が使えないということです。 Google 系のソフトの場合も Google ドキュメントや Google Keep などの場合は音声入力ができますが、 Gmail ではまだ音声でメールを書くことができません。ですので、 Gmail でも音声入力を使いたい時は Google ドキュメントなどでまず音声で日本語入力してから、それをコピーして Gmail にペーストするという方法を取らなければなりません。これはかなり面倒くさいです。できれば ATOK のように独立した IME として音声入力ができるようになってくれたらもっと便利になるでしょう。その点では、 iPhone の日本語入力ではキーボードの中にマイクのマークがあり、それをタップするとどんなアプリでも音声入力を使うことができます。 ですので、今のところパソコンによりもスマートフォンの方が音声入力が活躍する場は多いかもしれません。

言い換えると、パソコンで音声入力をする場合は、ツイッターのような短い文を書くよりも、ブログのような長い文章を書く方が向いていると言えるでしょう。


と思っていたのですが、実は Chrome の拡張機能を入れると、 Google ドキュメント以外の例えばGメールや Twitter などでも自由に日本語が音声で入力できることがわかりました。ですので音声入力を始めたばかりの時は上に書いたデメリットを皆さん感じるだろうと思いますが、 実際にはすぐに解決できる問題です。この Chrome の拡張機能のページは参考資料のところにリンクを貼ってあります。これ以外にもいくつか同じような拡張機能がGoogle ウェブストアに登録されているようです。

ただしこの拡張機能は Chrome でしか動きません。僕もようにクロームブックをメインのコンピューターとして使っている場合はこれで全く問題ありませんが、 Microsoft やアップルなどの OS を使っている人にとっては Chrome 以外のソフトを使うこともあるでしょうから、その場合は別のツールを使う必要があるかもしれません。

なお Windows の場合は Windows に付属の音声入力ツールがあるようです。これも参考資料のところにリンクを貼っておきました。 ただ、僕も職場のパソコンでこれを使ってみようと思ったのですが、Google や Apple の音声入力ほど簡単ではありません。最初に準備をしなければならないことがたくさんあったりするので、僕は実質的には使っていません。

【2018年にやってみたいこと】

それでは音声入力はブレーンストーミングに良さそうなので、2018年に目標にしたいことを羅列して行ってみたいと思います。

まず英語の勉強ですね。今まで読んだり聞いたりする インプットはかなり行ってきたので、今年はアウトプットの練習をしたいです。去年は途中から英語で書くブログの更新が止まってしまったので今年は頑張っていきたいと思います。

二つ目は、この音声入力をきちんとマスターしたいですね。これは仕事の効率が非常に良くなるのではないかと期待しています。僕の場合、何かの習慣を変えるときは、新しいことをたくさんしようとするよりも、古いやり方を辞める方が効果的だということがこれまでの経験でわかっているので、音声入力をきちんとマスターするには、できるだけキーボードで日本語を入力しないことが大事だろうと感じています。音声入力でも句読点などはキーボードを使って入力するので、それ以外のキーを隠してしまうカバーなどを作ってみようかと思っています。

それから運動に関しても続けていきたいと思います。オフィスから家までがだいたい4キロぐらいですから、特に荷物がないときや、健康上の問題がない時は、必ず走って帰るようにしたいと思います。あ、もちろん天候の問題もありますね。でも Edmonton は寒さ以外はそれほど大きな天候上の問題はありません。雨が降って走れないということはあまりないのです。ただ雪が降って道路が滑りやすくて走りにくいということはあります。しかし、これに関しては雪道でも走れるブーツを買ったので、多分今年の秋にはあまり大きな問題にはならないと思います。

日本語の先生方のネットワークを作るライフワークに関しては、今年ももちろん日本語教師チャットを続けていきたいと思います。それに加えて、オンラインのEdCampも是非行ってみたいと思います。

オンラインでの情報発信はもちろん去年までと一緒にやりたいと思っていますが、紙の本での出版も是非今年こそは実現したいと思っています。もちろんこれは出版社との共同作業ですから僕一人でどうなることではありませんが、内容が時代遅れになってしまう前に是非実現したいと思っています。

【その他】

さて、驚いたことに、今 Twitter にキーボードで投稿しようと思ったら、ものすごく面倒くさくてやる気が失せました。つまりそれだけ音声入力が楽で、かつそれに慣れてしまうのにもほとんど時間がかからないということです。

この音声入力が向いてない人はどんな人でしょうか。おそらくキーボード入力が非常に上手な人だと思います。世の中にはとても正確、かつ高速に日本語をキーボードで入力できる人がいます。ブラインドタイピングができる人も少なくありません。そういう人にとってはこの音声入力のメリットはあまりないかもしれません。また、「イノベーションのジレンマ」でも有名ですが、せっかく苦労して身につけた能力を代替してしまうような新しい能力を身につけることに抵抗を感じる人もいるでしょう。ただし僕はブラインドタイピングが上手ではないので、この音声入力はとても魅力的です。 もしかしたら高齢者にとってはとても良いコンピューターへのインターフェースになるんではないでしょうか。僕の父にも紹介したいです。

また、きちんと机で仕事をするタイプの人にとっては、常に目の前にキーボードがあるので、この音声入力の魅力もそれほど大きくないかもしれません。

実は以前、IC レコーダーを常に身につけていて、その都度、思ったことを吹き込んでいたりした時期が何年かありました。音声入力は、それに似た感覚です。そしてもちろん IC レコーダーの場合はそれを再生するのが面倒でしたが、音声入力なら文字なので読み返すのはとても簡単です。つまり IC レコーダーの入力の簡単さと、文字での読みやすさを兼ね備えたものがこの音声入力による文章だと思うのです。これはまさに革命的だと僕とは思っています。

実はまだ読んでいないのですが、経済評論家の野口悠紀雄さんが一冊の本をまるまる音声入力で書いたという例もあります。本の内容自体も音声入力が主なトピックになっているようです。 参考資料のところにリンクを貼っておきました。これから僕も読んでみたいと思っています。

さて、この文章を書き始めた頃、考えるのと同時に話すのが上手にできないように思いましたが、すぐに慣れてきました。もう今ならたくさん音声入力で長文が書けそうです。正直な話、どうして今まで音声入力を使わなかったのだろうと悔しいぐらいです。今年は音声入力でブログをたくさん更新していきたいと思います。どうぞよろしくお願いいたします。

そして冒険は続く。

【参考資料】
むらログ: 最近は音声入力がすごい。(2011)
http://mongolia.seesaa.net/article/203661731.html

むらログ: 音声入力で文字起こしが楽になる!(2011)
http://mongolia.seesaa.net/article/205041467.html

書籍『The Miracle Morning for Writers』
http://amzn.to/2CDPMRq

「音声入力による生産性の向上は、ざっくり「3倍」くらいのイメージ」 - 勝間和代が徹底的にマニアックな話をアップするブログ
http://katsumakazuyo.hatenablog.com/entry/2018/01/04/163638

VoiceIn
https://chrome.google.com/webstore/detail/voicein-voice-typing/pjnefijmagpdjfhhkpljicbbpicelgko/related
(Chromeの拡張機能で、 Google ドキュメント以外の例えば Twitter などでもパソコンから音声入力ができるようになるツールです)

書籍『話すだけで書ける究極の文章法 人工知能が助けてくれる』| 野口悠紀雄
http://amzn.to/2DT37Cj

Google音声入力が便利すぎる!?Googleドキュメント無料ソフトの使い方【パソコン、スマホ】 - 初心者のための簡単なブログの作り方
http://www.blog-support.com/entry/2017/06/05/220907

Google音声入力の精度が半端じゃない(他の音声入力ソフトとの比較やおすすめのマイクも紹介)
http://pasokatu.com/14226

Word文書を音声入力してみる(1/3):So-netブログ
http://win10.blog.so-net.ne.jp/2016-08-26

内容は音声入力とは全く関係ありませんが、実際に風呂場で音声入力を使って書いた記事はこちらです。
http://mongolia.seesaa.net/article/456056783.html

【コメントはソーシャル・メディア上の記事別ページヘどうぞ!】
https://www.facebook.com/MurakamiTheAdventurer/posts/1998064167148058
https://twitter.com/Midogonpapa/status/948922987767410688
https://plus.google.com/+YoshifumiMURAKAMI/posts/6rcksBnrNho
タグ:音声入力
posted by 村上吉文 at 22:30 | 日記 | このエントリーをはてなブックマークに追加