英語の音声に関する雑記帳

英語の発音について徒然と


INTSINTを使える目処が立ったか?

去年の ChoPhoサマースクールに参加して、プロソディーの(音韻表記に対比する意味での)音声表記たる INTSINT のことを知りました。もっとも、INTSINT 自体は、Daniel Hirst & Albert Di Cristo (eds.) Intonation Systems: A Survey of Twenty Languages (Cambridge University Press, 1998) で使われていたので、単に僕が知らなかっただけだったのですが、これを音声ファイルから自動的に生成する momel-intsint というツール(音声分析ソフト Praat のスクリプト)も CorPho では紹介してくれたので、これには大いに期待していました。

 

これを使って日本語話者による英語発音コーパスにおけるプロソディーの記述(中間言語ですから、英語の記述体系も日本語の記述体系も使えないのは当然ですね)の基礎にできるのではないか?と思い、できれば夏以降の学会発表につなげたいと思っていました。しかし、何しろ他の仕事が忙しくて(翻訳書と辞書のダブルパンチです)、ずっと試せずにいました。思い返せば、CorPhoでの実習ではターゲット曲線は出てきたものの、INTSINT の記号列は出て来なかったな…と思い出し、夏に向けて準備するなら当てにして良いのかどうかぐらい試さなければということで、今晩改めて試してみたら、果たして、.int ファイルがないとかいうエラーメッセージが出てスクリプトが途中で止まってしまい、ターゲット曲線はできたものの記号列はできずじまい。あれあれ、これは困ったな…ということになってしまいました。

 

しかし、この momel-intsint には yahoogroups を利用したメーリングリストがあるのです。これに早速登録して、スクリプトが途中で止まってしまうんだけど、という投稿をしました。

 

すると、ほとんどそれに呼応するかのようにモデレーターの Daniel Hirst 氏から投稿があり、一昨年ザールブリュッケンのICPhSで発表した新しいアルゴリズムに基づいたプラグインをグループのファイル置き場に置くから使ってみて下さい、ということでした。

組み込みは、この zipファイルの中にあるプラグインフォルダを丸ごと、自分のユーザーフォルダの中の Praat フォルダにコピーするだけなのですが、Windowsでフォルダをコピー&ペーストしようとしても、(Macで圧縮してあるせいなのか)サブフォルダと同じ名前で容量0のファイルがあったりしてうまく行きません。しかし最終的に、TUGZip という圧縮・展開ツールを使ったらうまく行きました。

 

これを使ってみた結果ですが、見事に INTSINT のターゲット列が Praat の TextGrid として生成されました。もちろん、音声波形の然るべき位置に align されています。その生成された記号列をどう扱うかはこれからの問題ですが、ひとまず、プロソディーの記述に明るい光が見えたのでした。

 

しかし、TextGrid を扱うとなると、やはりコーパス構築にはこれをインポートできる ELAN が適しているのかな…。ELAN には Phonのような、発音辞書を使った入力支援がないのが辛いのですが、INTSINT が音声波形に time-align されている以上、time-align という発想がない Phon は合わないのかな…とも思います。しかし、target と actual という tier が予め用意されているというのも Phon がいいと思う部分だからなあ…。分節音だけ Phon で入力してそれをXMLにエクスポートし、更に ELAN にインポートすればいいのかな?分節音は波形に align し直しという感じで(target は何に align すればいいのか分からないけど)。しかし、ELAN を見ると、インポート可能なのは Shoebox, Toolbox, CHAT, Transcriber, CSV, TextGrid となっている。Phon のエクスポートは XML と CSV だから、この CSV がうまくマッチするのかどうかが鍵ですね。

なお momel-intsint のメーリングリストですが、アメリカ版の yahoogroups にあります。URL は http://tech.groups.yahoo.com/group/momel-intsint/ です。



コメントを残す