2008年04月29日

日本語母語話者が近くにいない独習者に有益なツール「朗読君」

母語話者なら「これじゃ不自然だ」と思うのは承知で書くのですが、これ、なかなか便利です。文字を入力すると、それを読みあげた音声ファイルを瞬間的に作ってくれるのです

朗読君
http://egachan.net/pre/

これを有効に使えそうなのは、レベルは初級で、海外にいる学習者。しかも日本語母語話者があまりいないような地域の学習者ですね。

なぜかというと、中級以上だったら、自然な日本語で話すポッドキャストなどが大量にあるし、初級でも日本人と友達になれるぐらいだったら、こんなものはいらないからです。

ですから、本物の人間が話す教材用の音声が日常的に手に入る環境ならもっといい選択肢があるのですが、そういう条件の所なら合成音声でも有益なのではないかと思います。しかし、人工合成音声だからといっても、最近はなかなか侮れないんですよ。

たとえば、これをお聞きください。
http://api.satoru.net/text2voice/mp3/l/V/O/6/lVO63oY7UAk.mp3

これは次のうちのどれでしょうか。
「橋の端に端がある」
「端の橋に箸がある」
「橋の端に箸がある」

日本語の母語話者であれば、答えは簡単でしょう。つまり、このツールはおなじ「はし」でも漢字によってアクセントを使い分けているわけですね。

私は今ベトナム語を独習中ですが、ベトナム語も声調が六声もあり、文にしたときの音声がどうなるのか、なかなかイメージできません。これは私だけのことではなく、フラット化する世界では、これからどんどんそういう学習者が増えていくのではないかと思います。先生と接触できないまま、インターネットでも語学はある程度、身に付けられるのですから。

で、そういう学習者にとって、今回ご紹介した「朗読君」は非常に強力なツールになると思うのです。まあ、そりゃ、たしかに日本人の耳には不自然に聞こえますよ。しかし、先生が一人もいない環境で、自分が書いた文章を読み上げてくれる環境がある、という意味では、なかなかすごいことなのではないかと思います。少なくとも私は、これのベトナム語版があれば、日本にいる間は間違いなく常用しますね。ベトナムに行ったら、そりゃ人間の話すベトナム語で充分でしょうけど。

文字をmp3化することによって得られるメリットは、たとえばこれをiPodに落として通勤時間に聴くということも考えられます。これは勝間和代さんの主張でもあるのですが、私自身も目からの情報に頼りすぎていて、もっと耳を利用した情報収集をしないと、駅まで歩く時間などが有効活用できないな、と思っていたところです。

日本語の母語話者にとっても、こうした人工合成音声も実用レベルになってきたのではないでしょうか。

posted by 村上吉文 at 07:22 | Comment(5) | TrackBack(1) | 日本語hacks! | このエントリーをはてなブックマークに追加
この記事へのコメント
先日はおつかれさまでした。

お試しデモ版のため、朗読君のようにファイルを作成できない仕様なのですが、

私のお薦めの無料朗読サイトはペンタックスのデモです。以前『R25』で紹介されていました。
http://voice.pentax.jp/  トップ
http://voice.pentax.jp/17/23/ デモ

テキストを文字単位ではなく、「音素〜文節以上の長さ」で判断し、対応する音声ファイルを切り出して繋げ、繋ぎ目を微修正するらしく、私が聞いたものの中では、一番自然な発音だと思います。

さらに、「ショウ、ミサキ、ハルカ、KETE」の4人から声を選べます。

デモはバッファ処理なので、回線が遅いといまいちなときもあるのですが、試してみてください。(海外では地域が限られるかもしれません)

自習の時間に中級の学習者に教えたところ、ウェブを読みながら段落単位でコピペして聞いたり、シャドーイングしたりしてました。
その後、自分で「日本語の勉強がんばって!」と入力して笑ってました。
Posted by ミ ト at 2008年04月30日 12:24
うわっ、こりゃあ、確かに自然だ!
音節同士のつながりが、ずっと滑らかですね。

こういうのがあとほんの少しだけ進化したら、たとえば喉頭癌で声を失った人も日本語教師ができたりするのかもしれない。というか、独習だけでそうとうなレベルまでいけるなあ。

ところで、そういうのを書くブログ始めないんですか、ミ トさん!
Posted by 管理人 at 2008年05月01日 06:03
ペンタックスの合成音声ですが、あとはプロミネンスですよね。「まさにそこが問題なんですよ」とか言わせてみると、まさにそこが問題なのだと分かります。
Posted by 管理人 at 2008年05月01日 06:06
これなんか、つなぎは不自然だけど、プロミネンスはかなりいい線行ってるかも。
http://www.celsys.co.jp/products/narration/data/sample2.avi
Posted by 管理人 at 2008年05月01日 10:11
そこなんですね。
プロミネンスはテキスト(文字)自体が太字になっているなど何か付加情報がないとなかなか判断ができないでしょうね。単文の場合でさえも、人間は前のやり取りから推測して判断するのでしょうが。

…例えば、文章全体で何度も出てくる語句をキーワードとして認識して、その語は音量を大きめで少しゆっくり高く言うといったことはできるかもしれません(すでに行なわれているかも?)。

そのうち、このお笑い芸人の文章は語尾に「ぐー」がよく出てくるから「ぐー」を強調して出力すれば「ばっちぐー」ってな具合に判断できるようになるかなぁ (≧ω≦)bぐー

ブログは、落ち着き先が決まってからということで
Posted by ミ ト at 2008年05月02日 15:05
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]


この記事へのトラックバック

これはすごい!まるでプロ並みの読み方。
Excerpt: まあ、まずは聞いてくださいよ。三十秒ぐらいだから。 http://jp.fujitsu.com/group/labs/downloads/techinfo/techguide/voice-proces..
Weblog: むらログ
Tracked: 2009-07-28 06:12