東京外大がコーパスから自動収集した英語例文集をネット配信! 小学館と産学共同開発
東京外国語大学(学長:池端雪浦)は、世界最大の英語コーパスBNC(The British NationalCorpus)から抽出した英語の例文集『文法項目別BNC用例集』をネット配信します。
同『用例集』は東京外語大(佐野研究室)が作成した英語の基本的な文型パターン約1300をもとに、株式会社小学館(代表取締役:相賀昌宏)のコーパス分析ツールを使ってBNCから抽出したもので、現代英語の標準的な使用実態を反映した用例の総数は約20万に及びます。
英語教育用の画期的な素材集として「小学館コーパスネットワーク(企画・運営:株式会社ネットアドバンス)」のサイト上で公開され、BNCの契約ユーザーは無料で閲覧可能です。詳しくは小学館コーパスネットワークのサイトをご覧下さい。
URLは、http://www.corpora.jp/~scn2/bnc.html?page=top です。
BNC本体の検索は、「小学館コーパスネットワーク(SCN)」においてすでに500人以上のユーザーのよって利用されていますが、今回の共同プロジェクトによってより簡単に誰もがコーパスを利用できる仕組みが新たに提供されます。
開発にあたっては、東京外語大が英語教育で使われる構文に対応する文型パターン約1300を用意し、小学館は大規模コーパスからほぼ自動的にその文型パターンに合った用例を検索するツールを提供、そのツールを使用して外語大のスタッフがBNCコーパスから約20万の例文を抽出するという手順で行われました。
ユーザーは、文型ごとに分類されたわかり易いインタフェースで表示される用例に、簡単にアクセスすることができます。文型ボタンをクリックするだけで、用例を直ちに確認でき、英語運用の実際を体感できます。
基本語彙のみによる例文も表示
教育現場での利用を考慮して、基本的な語彙のみによって成り立つ用例の閲覧機能も設けました。一般の英語学習者にとって、現代のイギリス英語を生の形で提供するBNCコーパスの例文は難し過ぎるきらいがあります。
特に語彙のレベルは例文理解に大きな関連を持つところから、学習者にとってわかりやすいレベルに語彙を限定した例文集も用意しました。語彙レベルの限定には、小学館の『プログレッシブ英和中辞典(第4版)』による基本語彙(約1万5000語)を利用しています。今後はJACET(大学英語教育学会)の選定した語彙リストなどを利用して、さらに細かい語彙レベルの設定を可能にする予定です。
客観性を持った教材を短時間に
従来、教育現場で使われる英語用例文の作成には熟練したネイティブ・スピーカーや高い英語能力を持つ日本人による作業が欠かせませんでした。しかし、それらの教材作成には非常に膨大な時間と労力が必要であると同時に、選ばれた例文も作成者の経験や言語直感に頼って客観性に乏しいという反省もありました。
今回提供される例文は1億語という巨大コーパスから20万例の用例を抽出するもので、「自然な用例であるかどうか」についての客観的な(量的な)判断基準は明確で、コンピュータを使った高速検索は教材作成の時間を短縮し、そのコストも大幅に削減します。