SEWK-J stands for “Scale of English Word Knowledge - Japanese”. For the purposes of estimating the difficulty that vocabulary presents to Japanese learners of English, the SEWK-J list estimates the likelihood that a word is known to Japanese university students. The probability of knowledge of a word is based on a multiple regression performed by Dr. Geoff Pinchbeck (Carleton University) using vocabulary test data of the 149-item New Vocabulary Levels Test (McLean & Kramer, 2016) administered to Japanese University EFL students as the criterion (dependent) variable. The regression formula includes the following predictive variables to provide estimates for about 75,000 flemma headwords:
English L2 vocabulary yes/no test data – accuracy
English L2 vocabulary yes/no test data – reaction time
English-Japanese loanword – identity
English-Japanese loanword – frequency in Japanese
Age of Acquisition
Age of Exposure
A full description of the SEWK-J list will be provided in an upcoming publication.
In New Word Level Checker, Levels 1 to 10 represent the following word bands: L1 (1-500), L2 (501-1000), L3 (1001-1500), L4 (1501-2000), L5 (2001-2500), L6 (2501-3000), L7 (3001-4000), L8 (4001-5000), L9 (5001-7500), and L10 (7501-10000). “Over10” thus means the word is over 10,000 in the rank of SEWK-J.
If “SEWK-J: Fine-grained” is selected as the word list, up to 30 bands (each band with 250 words, 7,500 words in total) in the SEWK-J list are used for profiling, and words over the 30 bands will be categorized as “Over30”. This approach gives you a detailed understanding of how many words in the text the learners may know. When “SEWK-J: Fine-grained” is chosen, New Word Level Checker outputs (a) mean logit (log odds unit) difficulty of the input text as a whole, (b) mean logit difficulty of the content words, and (c) mean logit difficulty of the function words.
This list groups base word forms, inflectional forms, comparative and superlative forms.
A parallel word profiler can be found at https://nwlc.pythonanywhere.com/.
The first 5,000 flemmas of the list can be downloaded here. If you require more than the first 5,000 flemma please contact us.
SEWK-Jとは「Scale of English Word Knowledge - Japanese」の略です。SEWK-Jリストは、日本人英語学習者にとっての語彙の難易度を推定する目的で、日本の大学生がある単語を知っている可能性を推定しています。ある単語を知っている確率は、Geoff Pinchbeck博士(カールトン大学)が、日本の大学生EFL学生に実施した149項目の「新語彙レベルテスト」(McLean & Kramer, 2016)の語彙テストデータを基準(従属)変数として用いて行った重回帰式に基づいています。回帰式には以下の予測変数が含まれており、約75,000語のフレムマ見出し語の推定値が得られます。
英語L2語彙のyes/noテストデータ-精度
英語 L2 ボキャブラリー Yes/No テストデータ - 反応時間
英語と日本語の同義語 - アイデンティティ
英語と日本語の同義語 - 日本語での頻度
獲得年齢
曝露の年齢
SEWK-Jリストの詳細については、近日中に発表する予定です。
New Word Level Checkerでは、レベル1から10までが以下の単語バンドを表しています。L1(1-500)、L2(501-1000)、L3(1001-1500)、L4(1501-2000)、L5(2001-2500)、L6(2501-3000)、L7(3001-4000)、L8(4001-5000)、L9(5001-7500)、L10(7501-10000)です。"Over10 "は、このように、SEWK-Jのランクで1万を超える単語を意味します。
SEWK-J: Fine-grained "を単語リストとして選択した場合、SEWK-Jリストの最大30バンド(各バンドは250語、合計7500語)をプロファイリングに使用し、30バンドを超える単語は "Over30 "に分類されます。この方法により、学習者がテキストの中でどれだけの単語を知っているかを詳細に把握することができます。SEWK-J: Fine-grained」を選択した場合、New Word Level Checkerは、入力テキスト全体の(a)平均logit(log odds unit)難易度、(b)内容語の平均logit難易度、(c)機能語の平均logit難易度を出力します。
このリストでは、基本的な単語の形、屈折形、比較形、最上級の形をまとめています。
並列ワードプロファイラは、https://nwlc.pythonanywhere.com/。
リストの最初の5,000フレマはここからダウンロードできます。最初の5,000枚以上のフレマをご希望の場合は、お問い合わせください。
The New JACET List of Basic Words (New JACET8000) is the updated version of JACET8000 (JACET, 2003). The JACET8000 list was created by the Japan Association of College English Teachers (JACET). The JACET8000 is based on the British National Corpus (BNC) and the Corpus of Contemporary American English (COCA). The JACET8000 serves as an educational word list for Japanese learners of English, especially university students. The list has 8,000 words, and for each 1,000 words, the level (i.e., from 1 to 8). New JACET8000 can be downloaded from Dr. Shin Ishikawa’s website. JACET reserves the copyright to the list (JACET, 2016). A parallel word profiler can be found at https://nwlc.pythonanywhere.com/.
新JACET基本語リスト(新JACET8000)」は、「JACET8000」(JACET, 2003)のアップデート版です。JACET8000リストは、日本大学英語教育学会(JACET)によって作成されました。JACET8000はBritish National Corpus (BNC)とCorpus of Contemporary American English (COCA)をベースにしています。JACET8000は、日本人の英語学習者、特に大学生の教育用単語リストとしての役割を果たしています。JACET8000は8,000語で構成されており、1,000語ごとにレベル(1から8まで)が設定されています。新しいJACET8000は、石川先生のホームページからダウンロードできます。リストの著作権はJACETが保有しています(JACET, 2016)。並列ワードプロファイラは、https://nwlc.pythonanywhere.com/。
The New General Service List (NGSL) was released in 2013 by Dr. Charles Browne, Dr. Brent Culligan, and Joseph Phillips. NGSL is a modern update of the General Service List (West, 1953). It covers about 90 percent of general texts of English with a list of approximately 2,800 high frequency words. Dr. Browne and his colleagues continued to produce a series of word lists for learners who have mastered the first 2,800 words with NGSL. These include the New Academic Word List (NAWL), the TOEIC Service List (TSL), and the Business Service List (BSL), which have the following number of headwords in each list.
NGSL and other word lists are available on the NGSL website. The lists are licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
2013年にチャールズ・ブラウン博士、ブレント・カリガン博士、ジョセフ・フィリップスの3人が発表した「New General Service List(NGSL)」。NGSLは、General Service List(West, 1953)を現代的にアップデートしたものです。約2,800語の高頻度語のリストで、英語の一般テキストの約90%をカバーしています。Browne博士らは、NGSLで最初の2,800語をマスターした学習者のために、引き続き一連の単語リストを作成しました。これらには、ニューアカデミックワードリスト(NAWL)、TOEICサービスリスト(TSL)、ビジネスサービスリスト(BSL)があり、それぞれのリストの見出し語の数は以下の通りである。
NGSLおよびその他の単語リストは、NGSLのウェブサイトで公開されています。これらのリストはCreative Commons Attribution-ShareAlike 4.0 International Licenseでライセンスされています。
For details of the TOEIC Service List please see this page (http://www.newgeneralservicelist.org/toeic-list).
NGSL and other word lists are available on the NGSL website. The lists are licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
TOEICサービスリストの詳細については、こちらのページ(http://www.newgeneralservicelist.org/toeic-list)をご覧ください。
NGSLおよびその他の単語リストは、NGSLのウェブサイトで公開されています。これらのリストはCreative Commons Attribution-ShareAlike 4.0 International Licenseでライセンスされています。
For details of the New Academic Word List please see this page (http://www.newgeneralservicelist.org/nawl-new-academic-word-list).
NGSL and other word lists are available on the NGSL website. The lists are licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
TOEIC Service List の詳細については、こちらのページ(http://www.newgeneralservicelist.org/nawl-new-academic-word-list)をご覧ください。
NGSLおよびその他の単語リストは、NGSLのウェブサイトで公開されています。これらのリストはCreative Commons Attribution-ShareAlike 4.0 International Licenseでライセンスされています。
This lemmatized word frequency list was compiled from a revised version of the SubtlexUS corpus (Brysbaert, & New, 2009), which is composed of captions and subtitles from US TV and movies. This version of the corpus was further-cleaned and lemmatized and tagged by Geoffrey Pinchbeck (Carleton University) using the CLAWS4 tagger and the CLAWS7 tags (http://ucrel.lancs.ac.uk/claws/).
References:
Brysbaert, M., & New, B. (2009). Moving beyond Kučera and Francis: A critical evaluation of current word frequency norms and the introduction of a new and improved word frequency measure for American English. Behavior Research Methods, 41(4), 977–990. https://doi.org/10.3758/BRM.41.4.977