2018年10月14日

合成音声も進化中!

クリエイティブ・コモンズ・ライセンス


画像2018 (27).png

冒険家の皆さん、今日もラクダに揺られて灼熱の砂漠を横断していますか?

今年になってから「音声入力をよく使うようになった」ことはこのブログでもよく書いていますが、これは音声を文字化する技術ですよね。その反対に文字を音声化する合成音声とかTTS (Text To Speechとか)も最近かなり進んできているようなので、今日はこれについて備忘録として書いておきたいと思います。

ところで丸括弧とかもiPhoneの音声入力では普通に入力できるんですね。今日の記事ももちろん音声入力で書いております。

さて、合成音声というのは、パソコンなどで人工的に作られる音声のことです。僕ぐらいの世代の人には「ワレワレワウチュウジンダ」と同じ音程で平坦に読む遊びを子供の頃にやった記憶がある人もいるのではないでしょうか。先日惜しまれながら亡くなった車椅子の天才物理学者ホーキング博士もALSという病気で自分の声では話せなくなっていて、合成音声で講演などを行っていたのをご存じの方もいらっしゃることでしょう。僕も合成音声というとああいう抑揚のない話し方というイメージがあったので、最近の進化には驚いています。日本語教育関係者の間では合成音声というとOJAD(Online Japanese Accent Dictionary)のウェブサイトに載っている「スズキクン」というツールが有名なのではないかと思います。

その後、Googleアシスタントによく読み上げてもらうニュースのアプリで朝日新聞の「アルキキ」というのが実は合成音声であることに気が付きました。多分、初めて聞いた番組の途中で合成音声だと気がついたと記憶しているんですが、でも途中まで人間のアナウンサーが読んでいるのだと思っていたこともあり、それと気がついたときには本当に驚きました。

最近はChromeにもかなりいい合成音声の拡張機能が入っていて、あまり頭を使わない手作業の仕事をしている間に、興味があるウェブページを読みあげさせたりとか、そういう使い方も気軽にできるようになりました。読み上げさせたいウェブページを開いて、拡張機能のアイコンをクリックするだけです。僕がインストールしているのは、「Read Aloud: A Text to Speech Voice Reader」という拡張機能ですが、 これ以外にもたくさんあるようです。

そして、さらに驚いたのは先日インドの蟻末さんがTwitterでシェアしていたVoiceTextというウェブページです。このウェブページでは様々なキャラクターが読み上げてくれるだけではなく、それに喜怒哀楽の感情を込めてもらうことこともできるのです。

さて、これらの技術は語学学習の現場でどのように応用できるでしょうか。

実は一斉授業ではそれほど大きな変革というわけではないかもしれません。というのも、教室で同じコンテンツで勉強するのなら、合成音声ではなくて母語話者が録音した音声が使えるからです。合成音声が自然になったとは言っても、他に選択肢があるのなら人間が録音した音声の方が多少は自然であることは間違いないと言えます。もちろんを録音しなくてもそこに先生がいれば生の声で聞かせることもできますよね。

しかし自律学習や独習では、学習者が自分でコンテンツを探すことが多いです。 この場合はこうした合成音声は非常に役に立つでしょう。自分が興味のあるコンテンツが文字でしか書かれていない場合に、それを聴解のコンテンツにすることが簡単にできるわけです。そして音声データにすれば、通勤や通学の途中やあるいはジョギング中などでもずっと聴き続けることができます。

もう一つは、 ディスレクシアや学習障害などの一部に、これが役に立つことがあるかもしれないと思います。というのも、文字を見るだけでは理解できない人の中には、自分で読み上げても理解できないものの、他の人が読み上げてそれを音声で聞くことができれば理解することができるという障害の一種を抱えている方がいらっしゃるからです。

発達障害の人の中には以前にも栗原類さんの例でご紹介したように、手では字が書けないもののキーボードでは普通に入力できるという人もいます。それと同じように、 こうした合成音声技術を使えばICTに読み上げてもらって、教科書の内容が分かるという人もいるわけです。

このように教室内に ICT 機器を持ち込むことで、多くの問題を解決することができます。そういえば先日は、アメリカに留学している日本人が、先生の話がわからないので、指向性のあるマイクを教室に持ち込み、Googleドキュメントの音声入力の機能を使って文字化したら先生の話が分かるようになったという記事もありました。こうした困難さを抱えている人たちを支援するには、何も特別支援員が一人一人に寄り添って支援しなければいけないというわけではありません。もちろん予算が十分にあってそれができれば一番いいとは思いますが、まずは教育の現場で ICT機器を使うことを禁止するというような原始的な考え方を改めるだけでも多くの人を救うことができるということに僕たちはそろそろ気づくべきではないでしょうか。

そして冒険は続く。

【参考資料】
OJAD - Suzuki-kun: Prosody Tutor : http://www.gavo.t.u-tokyo.ac.jp/ojad/phrasing

Read Aloud: A Text to Speech Voice Reader
https://chrome.google.com/webstore/detail/read-aloud-a-text-to-spee/hdhinadidafjejdhmfkjgnolgimiaplp

共同開発の「朝日新聞アルキキ」が朝日新聞紙面特集に掲載されました - MinatoのBlog : http://blog.minato.jp.net/entry/2018/03/14/120651

音声合成の声優事務所 produced by VoiceText : http://voicetext.jp/voiceactor/

「話す方が4倍速い」生産性アップに音声入力。本執筆、おかず1品、英語授業の字幕も | BUSINESS INSIDER JAPAN
https://www.businessinsider.jp/post-160228

木下直子 「ひとりでも学べる日本語の発音−OJADで調べてPraatで確かめよ」
https://amzn.to/2CelNib

むらログ: これはすごい! CBIで英語学習。そこには先端技術が!
http://mongolia.seesaa.net/article/150816811.html

【コメントはソーシャル・メディア上の記事別ページヘどうぞ!】
https://www.facebook.com/MurakamiTheAdventurer/posts/2179684015652738
https://adventurers-hideout.slack.com/archives/CB6K25MCY/p1539475079000100
https://twitter.com/Midogonpapa/status/1051261348615614464
https://kotonoha.online/members/murakami/activity/603/

【電子書籍「むらログ」シリーズを購入して海外にルーツを持つ子どもたちを支援しよう!】
2014年以降のこのブログの内容はKindle本にもまとめられています。2018年中にこちらの本をご購入になると、その収益は全額が「海外にルーツを持つ子どもと若者のための日本語教育・学習支援事業」を実施しているNPO法人青少年自律援助センターに寄贈されます。ココ出版の『冒険家メソッド』は初版の本体価格の5%が同センターに寄贈されます。
https://amzn.to/2RiNThw
posted by 村上吉文 at 08:15 | 日記 | このエントリーをはてなブックマークに追加