英語の音声に関する雑記帳

英語の発音について徒然と


英語学習アプリの発音評定機能の品質に疑問

英語学習用のシステムやアプリに発音評定機能が搭載されていることは以前から知っていましたが、その内容を検証したことはありませんでした。少なくとも自分自身を含めて英語音声の専門家で、そういうものの開発に関与した人を知らないので、一体誰がどんな風に作っているのか分からない、恐らくあまり好ましい内容になっていないのではないか、という疑念はずっと抱いていたのですが、ひとえにそこまで手を伸ばす余裕がなかったからです。

しかし今年、上の子供が中学に入り、学校で採用したアプリを使うようになって状況が変わりました。これを機に、下の子(小6)とともに、それぞれ自分の部屋を与えたのですが、上の子は中学受験の勉強を居間で(母親の監視の下)やっていた習慣の名残で、現在も居間で勉強することが多く、僕の目の届く範囲で学習アプリを使うこともよくあります。イヤホンをつけていることが多いので、手本の音声までは聞こえませんが、本人が発音している声は普通に聞こえます。

最初に異変に気づいたのは、here を「キア」と発音したのに98点で合格したのを見た時のことでした。実際には、そんな発音の単語は英語にはないけど、それは何?と言って見せてもらったのが発端です。これはひどい誤動作だなと思い、試しに手本の音声を聞いてみたら、音声の切り出し方に不都合があったらしく、実際に [kɪɚ] と聞こえる音声でした。恐らく、[hɪɚ] の [h] の途中から切り出したせいで、無音からいきなりノイズになったところが [k] の破裂のバーストのように聞こえる結果になったのでしょう。だとすると、これは手本通りに発音したものを98点とした訳で、手本はおかしいけど、判定動作自体は正しく動いているということなのだろうか、とその時は思いました。

しかし、より決定的な不都合に出逢うまでに、それほどの時間はかかりませんでした。その時は、正しく(許容範囲の)発音をしているように聞こえる単語を、10回も20回も一生懸命繰り返していました。合格点(80点)が取れないからだと言います。合格できないと次に進めないので、何度でも繰り返すしかないということです。どうも、できない単語を後回しにして先に進むということができない仕組みになっているようで、これ自体、学習上とても疑問のある仕様だと思うのですが、問題は評定の中身そのものにあるということがわかりました。

その時やっていた単語は famous でした。子供の発音は確かに許容範囲なのですが、[ˈfeɪməs] ではなく、最初の母音が高めの単純母音になった [ˈfɪːməs] になっていました。何故そんな発音をしているのか気になって試しに手本音声を聞いてみたら、果たして [ˈfɪːməs] になっていました。つまり手本通りに発音したにもかかわらず、不合格とされてしまった訳です。これは一種の「罠」になっていました。

face の母音 /eɪ/ を [eɪ] でなく [ɪː] とする発音は、アメリカでは、ど真ん中の標準発音とまでは言えないとはいえ、けっこうよく聞かれる発音です。IPA Handbook に「アメリカ英語」として載せられているものは実際にはカリフォルニアの発音ですが、この図のように、/eɪ/(図中では e と表記)はむしろ kit の母音 /ɪ/ よりもやや高い位置にプロットされており、famous を [ˈfɪːməs] としてしまう種類の発音です。僕が2012〜2014年に在外研究で滞在した東海岸のフィラデルフィア(ニューヨークとワシントンの中間にある大都市)もそういう発音で、場合によっては、更に高い [iː] を用いて [̇fiːməs] のようになってしまうことすらあるようです。僕はそのせいで wait を week に聞き違えて慌てた経験があります。

ともあれ、アプリの手本音声が [ˈfɪːməs] になっていること自体、この発音がかなりありふれたものである証左だといえます。そして、手本として提示している以上は、少しばかり標準からずれていたとしても、この発音を合格にしなければならないのは当然のことです。手本をきちんとなぞった発音が合格できないようでは、語学学習の根底をなす「模倣」が成立しなくなってしまうのですから。

このアプリの発音評定エンジンは評定基準を内部に持っていて、学習者に提示する手本音声を参照していないということなのでしょう。評定基準をどのように定めたのかということは完全にブラックボックスで、恐らくは、教育的にあるべき水準よりも「厳しい」基準になっているものと思われます。(にも関わらず、here を「キア」と言って98点が取れてしまうような矛盾も内含しています。)

数日前にもう一件、僕を呆れされた判定がありました。それは towel の発音です。子供は何度も [ˈtaʊl̴] と発音していたのですが、合格点が取れていませんでした。そこで、[ˈtaʊəl̴] と(2音節で)発音してみるように助言したら合格点が取れました。手本の音声を確認したら、果たして [ˈtaʊl̴] と1音節で発音されており、子供は今回も、手本通りに発音したら不合格という「罠」にはまっていました。

辞書では towel の発音は /ˈtaʊ(ə)l/ と記載されているのが普通です。つまり、2音節の /ˈtaʊəl/ も1音節の /ˈtaʊl/ も、どちらも「正しい」発音なのです。上で触れた famous については、[ˈfɪːməs] が辞書に記載されていない発音だという意味で、開発元に同情の余地がありましたが、この towel の場合、辞書に記載されている発音でさえ正解の中に含め損ねているということで、同情の余地はありません。

しかも、どちらの場合も、手本として提示されている発音を忠実に真似すると不合格になってしまうわけです。こんなもので発音の評定をされることは、明らかに有害です。

わずか3つの事例ですが、このような不適切な評定を他の単語でも行なっている例があるのではないかと疑わせるには十分でしょう。ここでは単語の評定だけを扱いましたが、文の発音についても、何を基準に点数をつけているのか分からない、発音を間違えた単語を指摘するというフィードバックしかなく、どこをどのように直したら点数が上がるのかをまったく知らせていないという問題があります。

つまりこのツールは、その発音評定のあり方について、全面的・徹底的な検証が必要です。そういう不完全な(あるいは欠陥を含む)代物でありながら、多くの学校で採用され、使われています。採用する側の学校の英語の先生方は、一体このツールをどのように評価して採用したのでしょうか。このような無責任な採用により、多くの生徒の英語の発音練習に混乱をもたらしていることは想像に難くありません。

検証といっても簡単ではありません。外にいて様々な発音でしらみつぶしに試すのには、気の遠くなるような時間と労力が必要でしょう。開発元に乗り込んで行って、おかしいところを直すから中身を見せろと言えれば多少は効率が上がるでしょうが、現実的ではありませんし、どういう義理があって、そんな「サービス」を提供しなければならないのか、とも思います。何より僕は、残り時間の限られた研究生活を、このような後ろ向きのことに費やしたくありません。読者の中に、我こそはという方が現れて下さると助かるのですが、その人にとっても後ろ向きの仕事になることは変わりないので、敢えて薦める気にはなれません。

いちばんいいのは、この文章が当該ツールの開発元に伝わり、内部で自主的に検証と修正をしてくれることです。ただ、僕は上に書いたようなことを、Twitterで簡略的に発信していたのですが、それを見て何かの動きがあったとは寡聞にして知りません。ブログはTwitterよりも拡散力が低いので、この記事によって伝わるということは期待薄かもしれません。ただ、ある程度の長さの文で書いたことで、自分の意は尽くすことができました。

今回僕が取り上げたのは、子供の中学で採用されている学習アプリですが、世の中に出回っている他のツールにも同じような問題があるという話も聞きます。救いのない話ですが、結局、劣悪なツールで邪魔されながらの発音学習が続いていってしまうのかもしれません。



“英語学習アプリの発音評定機能の品質に疑問”. への3件のフィードバック

  1. 牧野先生,興味深い記事でした.

    音声認識は10年以上前から普及していて,その当時英語の発音を判定するソフトが出たとか出ないとか聞いた覚えがあります.数年前に,単語レベルではなく,まとまった英文を読み上げるとそれを判定するソフトに出会ったこともあります.

    この手のツール,確かにまだまだ改善の余地があるのでしょうが,機械だけにちゃんとアップデートすれば,つまり,判定の許容度を調整し,複数の発音があるものは複数正解として登録し,という作業を進めれば,もちろん,開発元にその気(と予算)があれば,なんでしょうが,かなり役に立つのではないでしょうか.

    というのは,学校はともかく,塾・予備校で英語を教える講師がきちんと発音できているかというと,さにあらず.むしろ誤った発音で覚えて,それを直さないままでいる講師に発音を指導される方が,この手のツールで学習するよりもずっと被害が大きい気がします.

    塾・予備校の英語講師の発音がどれだけひどいかというと,もちろん,中には帰国子女なのできちんと発音できますという講師もいるのでしょうが,多くは英語の教員免許がある訳ではなく,音声学を学んだ訳でもなく,なので,つい最近もflewを「フリュー」,grewを「グリュー」と読み,Arabicを2つめのaに強勢をおいて読み,というのを耳にしました.英音と米音が混在していることも意に介していないようで,notやlotは英音でwhatやsureは米音で読むのは日常茶飯事です.

    参考書を何冊も書くような,有名な予備校講師ならばちゃんと発音しているかというと,これもYouTubeなどの映像授業サンプルを見るとほとんど期待できないですし,大学入試用に星の数ほど出版されている英単語集も,母音が原則米音なのにrhotic rがイタリック体という「なんちゃって米音仕様」がほとんどで,中にはご丁寧にrhotic rがすべて省略されたものまであります.

    結局,発音・アクセントの入試における配点が低く,優先されるのは文法,解釈で,そちらで点を取るのが基本という考えが支配的で,だから発音・アクセントは指導できなくてもよい,あるいは,講師自身がちゃんと発音できなくてもよいと思われている節があります.発音・アクセントの単独の出題がセンター試験ではありましたが,共通テストでは消えてしまいました.いっそのこと,入試の配点の50%くらいを発音・アクセントにすれば,さすがに塾・予備校もちゃんと発音しなければ,と考えるのかもしれませんが.

    ということで,まともなレベルになる可能性のある機械の方が,誤った発音の講師の指導を受けるよりも,まだ希望が持てるのではないかと考える次第です.

    いいね

    1. 牧野武彦 (MAKINO Takehiko) のアバター
      牧野武彦 (MAKINO Takehiko)

      こちらもお返事が遅れました。
      機械の方がいい加減な人間よりもマシなのではないかというお気持ちは分かります。翻訳ツールについて同じようなことを思っている人も多いでしょうね。
      ただ、機械に判定させるとして、どの範囲までを正解とするのかを決めることが事実上不可能だという問題があります。私自身、範囲を設定してくれと頼まれても自信を持って決めることはできないでしょう。ターゲットとする変種を1つに決めてあってもです。そもそも今の生徒は学校からだけ英語を吸収する訳ではないので、学校で扱っている変種だけを正解とすることも適切ではありません。
      もちろん、人間がやった方がうまく行くという訳でもないのですが、機械は杓子定規なので、妥当でない設定があると学習者に与える被害も甚大になるというのが怖いのです。

      いいね

  2. 確かに機械判定も今現在は難しい部分が多いですね.ただ,今後AIがどれだけのスピードで進化するかにもよるのでしょうが,スマホアプリのDuolingoですら,判定の精度はともかく,音声判定を今現在実装しているので,この先,膨大な音声データを学習して,機械が多くの変種を許容できるようになる日は遠くないような気もします.人間の方は,少なくとも塾・予備校の講師にはずっと期待できないような….

    いいね

牧野武彦 (MAKINO Takehiko) への返信 コメントをキャンセル