2013年07月24日

外国語でも自然な表現かどうかをすぐに調べることができます。 GTE学習法のご紹介

クリエイティブ・コモンズ・ライセンス


Google Booth

以前、こんなことを書いたことがあります。

「こういうときに、JavaScriptだとウェブ上に例文がたくさん転がっているので、書き方を比較して自分の間違いを探すのは簡単ですね。しかも、きちんと機能するかどうかの検証もブラウザがあればすぐにできるし。自然言語(日本語とか)の独学よりは、JavaScriptの独学の方がずっと簡単そうです。」
http://mongolia.seesaa.net/article/46248836.html

日本語にかぎらず、外国語の勉強をする時、「自分の使った表現が正しいかどうか」を確認するのはそんなに簡単ではありませんでした。漢字一つの問題とか、あるいは動詞の活用などなら教科書を見れば間違いであることが確認できることはありましたが、コロケーションの問題などは基本的に母語話者に見てもらわないと確認できないのが普通だったのです。

ところが、javascriptなどのプログラミング言語などを学ぶ場合は、先生に聞いてもらうまでもなく、実際にそれを動かしてみればその場で結果が分かるのです。特にjavascriptは簡単で、「メモ帳」などのテキスト編集ソフトでコードを書き、それを保存してからChromeなどのブラウザで開くだけでいいのです。C言語というのを勉強したときは、「はぁ?そんなわけの分からないコードは受け付けられません」というようなことを、もっと遠回しな表現でコンパイラーに言われることもありました。

どちらの場合も「どこが違うのか」「どうすれば動くのか」というのはすぐには分からなくても、「これではダメだ」ということだけはすぐにフィードバックされる点で、人間の言語を学ぶよりもずっと効率的だと思いました。「だめだ」ということだけは分かるので、動くまでトライアル&エラーで続ければ、正解が分かる時もあります。残念ながら、コミュニティで人に聞かないと分からない場合もありましたが。

さて、上のブログを書いたのは今からもう6年も前のことなんですが、6年たってみると、このプログラミング言語の学習方法と自然言語の学習方法の違いがどうも少なくなってきているように思うのです。今、ハンガリー語を学んでいる状態を振り返ってみると、6年前にC言語とかjavascriptとかを勉強していた時の感覚に非常に近い。それはなぜかというと、ダメならダメとけっこう簡単に分かる上に、トライアル&エラーで正解まで辿り着けることが多いからです。

では、どうやって特定の表現の自然さを判定してもらうのか。

それはGoogle翻訳とGoogleフレーズ検索の組み合わせです。

Googleフレーズ検索だけなら6年前にもすでに可能だったのですが、最近急に使い勝手が良くなってきたGoogle翻訳を組み合わせると、プログラミング言語を学んでいた時のようなリアルタイムの「トライアル&エラー」が実現できるのです。

たとえば、先ほど調べた表現は「私はハンガリー語の母語話者です」という表現。これを調べるには、まずGoogle翻訳で「I am a native speaker of Hungarian.」をハンガリー語に翻訳します。

結果は“Én egy-egy anyanyelvi magyar.”

次に、これをGoogleでフレーズ検索します。「フレーズ検索」というのは、それをひとかたまりのフレーズとして検索するという意味です。フレーズ検索にしないと、上の例で言えば「Én」「egy-egy」「anyanyelvi」「magyar.」などがバラバラに含まれているページが多数ヒットしてしまいます。ですから、ひとつの表現として正しいかどうかの検証ができません。

フレーズ検索をするには、その表現を二重引用符ではさみます。

で、この「Én egy-egy anyanyelvi magyar.」をフレーズ検索すると、一つもヒットしません。よほど特殊な内容ならともかく、こんな一般的な内容で一つも例が見つからないということは、要するにそれがハンガリー語の表現として間違っているということに他なりません。

ところで、この表現、一つ一つの要素はそれほど難しいものではありません。
Én は「私」の意味です。
egy-egy 2つ、つながっているのは見たことがありませんが、egyは数字の1です。
anyanyelvi これもつながっているのは見たことがありませんが、anyaは「母」、nyelviは「言語の」です。
magyar. ハンガリー
この中で「egy-egy」がいまいち分からないので、これを検索してみるとwictionaryに「mindenki kapott egy-egy almát. each got an apple」という例が載っていました。「1つずつ」というようなニュアンスかもしれませんね。それで、もとの例文からこの「egy-egy」を削除してフレーズ検索してみます。つまり、"Én anyanyelvi magyar."です。

でも、こうやっても検索結果はゼロです。まだハンガリー語として間違っているとしか思えません。ハンガリー人はもしかしたら自分の母語を説明したりしないだろうか、とふと不安が頭によぎり、今度は先ほどの「ハンガリー語」を「英語」に相当する「angol」に入れ替えて検索します。つまり、"Én anyanyelvi angol."です。

でも、これも例がひとつもありません。やはり間違っているのでしょう。

次に、「anyanyelvi」の最後の「i」を削って検索してみます。僕が勉強した大阪大学のサイトには載っていませんでしたが、多分これは「〜の」に相当するらしいので、直訳すると「私は母語の英語です」という意味に見えるのです。で、"Én anyanyelv angol."を検索してみました。

検索結果は1件ありました。でも、当然、これはハンガリー語ではなく英語の母語話者の書いた表現ですから、間違っている可能性があります。また、これは「私は英語の母語話者です」ではなく、「私の母語は英語です」という意味に見えないこともありません。

それで、今度は「anyanyelv」に「私の」を意味する接尾辞の「em」をつけて検索してみます。つまり、"Én anyanyelvem angol."です。こうしてみると4件がヒットしました。この場合の文頭の「Én」は「私は」でなく「私の」を強調することになるので、なくてもいいはずです。それで、"anyanyelvem angol."だけにして検索してみました。

今度は204件のヒットがありました。だいぶ自然になってきたようです。しかし、いかんせん英語の母語話者が書いていることですから、やっぱり信用していいかわかりません。それで、「私の母語は英語です」でなく「私の母語はハンガリー語です」にして検索してみました。"anyanyelvem magyar."ですね。

今度は3190件もヒットしました。まあ、ハンガリー語の母語話者がこれだけ多く使っているのなら、何かが足りないことはあっても、間違っていることはないと言えそうです。ところで、検索結果をみてみると、「anyanyelvem」に定冠詞の「az」がついている例が多いので、"Az anyanyelvem magyar."にして検索し直します。

そうすると、今度は11,100件もヒットします。ここでどうして増えるのか理解できないのですが、まあ、時々こういうことはあります。いずれにせよ、11万件も例が見つかるということは、ハンガリー語として自然であると考えて間違いないのではないかと思います。

まあ、いつも必ずこのような正解にたどりつけるわけでもないのですが、ネット時代以前は「その表現は間違っている」ということすら確認できなかったので、それが分かるというだけでもすごいことです。個人的には、こうした勉強方法をGoogle Trial & Errorの略でGTE学習法と呼んでいます。

エンジニアのタマゴたちがプログラミング言語を効率的に身につけていくように、今では自然言語もリアルタイムでその自然さが確認できるようになっています。日本語もこうして効率的に学べるように指導していきたいものですね。
posted by 村上吉文 at 11:29 | Comment(0) | TrackBack(0) | 日本語hacks! | このエントリーをはてなブックマークに追加
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック