綴り字で書かれた英文から発音(音素)表記を生成するツールが存在する。スマートフォンのアプリになっているものもあるが、多くはWebサイトである。今回は、そのようなツールが生成する表記の妥当性を検討し、これらがどの程度使い物になるのかを見ていく。
検討のための材料の英文として、ランダムに思いついたものだが “I was thinking of purchasing a camera before going home.” を使うことにする。
まずは、主に音声工学系で古くから用いられている The CMU Pronouncing Dictionary を見てみよう。このツールは一度に入力できる語数が少ないため “instead of going home” で試してみた。
IH2 N S T EH1 D . AH1 V . G OW1 IH0 NG . HH OW1 M .
IPAではなく、ASCII文字だけを用いたARPABETによる表記である。「語強勢を表示」のオプションを付けて出力させたところ、全ての単語に第1強勢を意味する “1” が含まれた。of のように、文強勢(文アクセント)を受けずに弱形で現れるはずの単語も強形で出力されている。個別に辞書を引いたものをつなげただけで、文の発音を適切に示すものにはなっていない。
一度に入力できる語数の制限も含め、そもそも文の発音を出力することを想定していないのだろう。
次は一部で高い評価を得ているという印象がある toPhonetics である。“I was thinking of purchasing a camera before going home.” を使った。
aɪ wəz ˈθɪŋkɪŋ əv ˈpɜrʧəsɪŋ ə ˈkæmərə bɪˈfɔr ˈgoʊɪŋ hoʊm
ここでは「弱形を表示」のオプションを付けた。結果として、was, of, a は弱形で出力されている。それ以外の単語は引用形で出力されているのだが、問題は単音節語の扱いだ。最初の “I” と最後の home に強勢符号が付いていない。 “I” については、文強勢を受けないのが基本であるため、たまたま問題ない表記になっているが、home に強勢符号がないのは文強勢を正しく示したことにならない。
これは恐らく、元となる辞書データで単音節語に強勢符号が付いていないことの反映だろう。
実際のところ、多くの辞書で強勢符号は単語の中での強弱パターンを示すためにだけ用いられ、内部に比べる音節の存在しない単音節語には強勢符号を付けないという規約を用いている。ODE (lexico.com)、American Heritage のような一般辞書、OALD、LDOCE、CALDのような学習者用英英辞典、EPD、LPDといった発音辞典、英和辞典でもウィズダム(三省堂)、レクシス(旺文社)などがそうなっている。
確かに、単語の内部の話だけで済むのであればこの表記を一概に否定することはできないのだが、このように、文の強勢を生成するためにそのまま用いると問題が起こる。本来想定されていない使い方であるとしても、このような「誤り」を生んでしまう表記は避けるべきではないだろうか。
更に、単語を単独で発音したものだけを表すと想定した場合でも、実は問題がある。単語は引用形の場合は必ずイントネーションを伴って発音されるのであり、単語の第1強勢は核音調のアンカーとして働く。単音節語だからといって強勢符号を表記しないことは、このアンカーを示さないということになるのであり、実は単語の発音表記としても一貫しない扱いなのである。
単音節語にも強勢の表記をしている辞書としては Merriam-Webster(学習者用・一般用とも)、 Collins COBUILD、僕が手がけているグランドセンチュリー英和辞典(三省堂)、ジーニアス英和辞典(大修館書店)、研究社の一連の辞書(大英和、リーダーズ、中英和、ライトハウス、コンパスローズ)がある。上記のCMUも単音節語に “1” が付いているという点において、辞書としてはこちらに含められる。
/aɪ wʌz ˈθɪŋkɪŋ əv ˈpɜːrʧəsɪŋ ə ˈkæmʌrə bɪˈfɔːr ˈgoʊɪŋ hoʊm/
このツールでは camera の表記に誤りがあり、元となる辞書データに不備があることが伺える。更に、不定冠詞の “a” のみ弱形が出力されているが、その他の単語は、弱形があるもの(ここでは was)でも強形が出力されている。プラス、単音節語では強勢符号が付いていないという点で、三重の問題を抱えている。
| ˈaɪ wəz ˈθɪŋkɪŋ əv ˈpɝːtʃəsɪŋ ə ˈkæmərə bɪˈfɔːr ˌgoʊɪŋ hoʊm |
このツールでは、弱形のある単語(was, a)では弱形を、そうでない単語では強形を出力している。単音節語も含めて強勢符号を付けているように見えるが、goingに付いているのが第2強勢である点、homeに何故か強勢符号がないという不統一があり、これが何に由来するものなのか不明である。
また “I” と before に第1強勢が付いているが、機能語であるこれらの単語では強勢を表記しないほうが正しい。辞書から直接データを引いていることによる限界である。
これに関連して、上記すべてのツールについて言えることとして、(単音節語の強勢表記と弱形を持つ機能語の問題を除き)すべての単語に第1強勢を与えていることには問題がある。英語では(弱強勢を捨象して)第1強勢ばかりが続くパターンはリズム的に嫌われ、第1強勢と第2強勢が交互に現れようとするからである。この例の場合、thinking, purchasing, camera, going, home のうち、purchasing と going は第2強勢のほうが適切だろう。(但し purchasing は意味的に重要なので、リズムを犠牲にして第1強勢になるということも考えられる。)
このレベルの自動生成ツールでは、そこまできめ細かい処理を行えないということだと思われる。結論としては、これらのツールは文の正しい発音を得るという目的には使えないと言わざるを得ない。
但し世の中に存在する、音声合成で出力されている発音に、今まで述べてきたような「不適切」な発音が生じてしまっているという印象はない。要は、ツールの「レベル」の問題なのだろう。
コメントを残す