Welcome to DREC-J, a degree of reading ease calculator for Japanese EFL learners

東北大学大学院国際文化研究科・岡田研究室プロジェクト(OLP)の一環として開発されたwebシステムDREC-Jへの入り口ページです。

DREC-Jを有効に利用して、効率と効果の高い自律学習を外国語としての英語(EFL)読解力養成の場で実現するためのポータルページです。いくつかの項目を、画面左側リストをクリックして確認した後、一番下からDREC-Jに入ります。

DREC-Jは、あなたがcopy & pasteしたり、キーボードで打ち込んだ英文書の、あなたの英語語彙力からみた「読み易さ(読み難さ)」の程度を測定してくれます。また、語彙的な密度、つまりその英文書には名詞や動詞や形容詞などの意味を持った単語(内容語)が、どれほどの濃さで用いられているかも測定してくれます。相当に読みにくい、いわば「堅い」科学論文などでは一般的な語彙密度は70%ほどになるといわれています。反対に子供向けの物語や、会話文になると、この密度はぐんと下がって50%-40%になるといわれます。

【日本人EFL学習者の語彙レベル】

卯城(2009) 等の研究によると、(ジャンルにもよりますが)対象とする英文のおおよそ、95%以上の単語を理解できればスムースに読み進めることができる、とされています。この、カバー率95%に達するためには約10,000見出し語を習得する必要があるとも指摘されています。では、一般的な日本人EFL学習者はどれほど英単語を学習することになっているのでしょうか。

平成25年度の学習指導要領では:中学校3年間で約1,200語、高等学校3年間で約3,000語 (これに、それぞれの教科書で採用されている任意の単語が加わります) とされています。

東北大学の個別学力試験で出題される英文の語彙レベルは、おおよそ4,000~5,000語で、このレベルを超える単語には注釈が付されます。実用英語検定では: 4級:約1,300語、 3級:約2,100語、 準2級:約3,600語、 2級:約5,100語、 準1級:約7,500語、 1級:10,000~15,000語 という単語数の目安があります。

(多様性があるので一概には言えませんが、英語母語話者であれば40,000語以上を身につけていると言われます。この単語数なら、広い範囲の英文の98%以上の単語をカバーすることになります。)

【語彙力測定】

DREC-Jを使って、学習の対象としたい英文の難度を測定する前に、外部の簡単なサービスを用いて自分の語彙力を測定します。ここで得られた結果をもとにして、プルダウンの選択の中から自分のレベルを指定します。

DREC-Jは、このレベル情報を受け取り、例えばレベルが3 (3,000~3,999語)のユーザーならば、対象となる英文の中の、「レベル4 (4,000語)以上の値を持つ(固有名詞類を除いた)内容語の見出し語リスト」の「全体の(固有名詞類を除いた)内容語の見出し語リスト」に対する割合を%で示します。つまり、あるレベルの語彙力の学習者にとって、そのレベル超えの、「未知の単語」がどれほど含まれているかを%で教えてくれます。この数値が低ければ低いほど、そのレベルの学習者にとっては「読み難さ」の度合いが低い、つまり「読み易い」ということになります。

【見出し語(レマ)】

ここで重要なのは、このように習得すべき英単語数を数える際に、「見出し語」という単位でカウントしているということです。「見出し語」は「レマ(lemma)」などと呼ばれることもありますが、分かりやすく言えば、動詞の活用や名詞の数や形容詞の級などで異なるひとつひとつの単語を数えるのではなく、辞書でそれらを調べるときのように、「元の形」つまり(辞書や単語集の)「見出し語」ひとつにまとめ上げて、その数をカウントしているという事です。do, did, done, doing, doesをDOという「見出し語」として1つと数えます。big, bigger, biggestを3つと数えるのではなくBIGとして1つと数えます。もちろん変化しないput, put, putなども「見出し語PUT」としてまとめられます。 DREC-Jでは、この「見出し語(レマ)」を活用しています。

【機能語と内容語の区別】

DREC-Jでの英単語の扱い方には、もうひとつ大きな特徴があります。それは単語を「機能語(function word)」と「内容語(content word)」に区別して、それぞれのグループ内でのレマに注目して読み難さの度合いを測定しようとしています。

一般的に機能語とは、それ自体の意味を持たずに英文中で単なる機能を果たす単語のことを言います。典型的なものには冠詞のathe、代名詞のitや前置詞のofなどがあります。しかし、DREC-Jではこのように単語の品詞に基づいて2つのグループを区別するのではなく、固有に意味のあるものを内容語とし、それ以外のごく限られた単語を機能語として分類しています(2017年1月現在の語彙リストには32種類の機能語しかありません)。しかし、例えば前置詞であっても、nevertheless, nonethelessなどのように、それ自身の意味をはっきり持っている単語は内容語として語彙のレベルも与えられて分類されています。

機能語の94%はレベル1、つまり中学校で学ぶもので、定冠詞theのようなものは、英文中には実際には多数出現しますが、どれほど数が多くてもそれが学習者にとっての「読み易さ・読み難さ」に影響を与えることはありません。従って、theの出現回数を問題にするのではなく、そのレマであるTHEが1回としてカウントしています。

このように、機能語であっても内容語であっても、それらがレマとして収斂された形で、対象英文中に何回出現しているかを単純にカウントするのではなく、その種類数だけをカウントします。つまり、ある単語が3種類の活用形・変化形(これを具現形と言います)で英文中に出現したとすると、それは1つのレマにまとめられます。

例えば、nominate, nominated, nominatingという具現形はNOMINATEとして、まるで自分の単語帳か単語リストに記載するときのように1つの項目としてまとめられ、それが異なった活用形で合計3回用いられていたと考えるわけです。3つの具現形を1つのレマで割った割合(33.3%)を、ここではレマの比率、「レマタイプ・レマトークン割合」と言います。

そして単語レベル1~13まで(1,000語~13,000語)が与えられている「すべての内容語」にこの方式を当てはめて比率を出します。

学習者から考えると、機能語は対象とはせずに、内容語の中で、自分の語彙レベルを超えた単語がどれほど用いられているのか、つまり対象の英文は自分の語彙力からみて、「どれぐらい読みにくいのか」を示すのがDREC-Jの機能です。そのために、単純な単語の扱い方をせずに、このように「見出し語」の種類数に注目するという丁寧な処理がなされています。

DREC-Jが処理の対象とするのは、おもにTOEFL®テストのreading sectionで用いられるような内容と長さの英文パッセージです。従って、学習者自身にとって自分の語彙レベルを超えた単語つまり「未知の単語」がレマに収斂したとしても、何回現れているかはあまり重要な指針にはなりません。従って、「このパッセージを読むときに、「自分にとって障害となる難度の高い見出し語」の、「すべての内容語の見出し語のリストに対する割合」を計算しています。

【固有名詞類の扱い】

もうひとつDREC-Jの計算方法にとって重要なことは、英文中の固有名詞を除外しているということです。Thompsonのような固有名詞やAmericanのような固有形容詞は、それ自身が重要な意味を持っているのは明らかですが、TOEFL®TOEIC®、IELTSのように、学習者の英語読解力を世界標準の尺度で測定しようとするテストで用いられるパッセージの中の固有名詞類は、読解力測定に何の影響も与えないように設計されています。簡単に言えば、パッセージの主題がBob Dylanであっても、ボブ・ディランを知らないとその英文が理解できない、というのではないようにされています。つまりBob Dylanでなくても、固有名詞のXXX YYYYYであってもいいのですが、それでは英文としてあまりにも不自然なために実名が用いられているにすぎません。要するに世界水準の英語読解力測定テストにあっては、固有名詞類は無視しても構わないという結論になります。DREC-Jでは、パッセージ中の固有名詞類を、上の計算式には算入しないように設計されています。固有名詞を除いた純粋な内容語だけを計算の対象としているわけです。

  1. DREC-Jの機能と使い方(マニュアル)
  2. あなたのCEFRレベルを測定
  3. CEFRレベルに応じた英語読解力養成用の教材
  4. あなたのEFL語彙力を測定
  5. 役に立つシステム
  6. DREC-J入口