組織・機関
ICAME (International Computer Archive of Modern and Medieval English) [英語コーパスの収集・配布を行う国際機関です]
OTA (The Oxford Text Archive) [あらゆる言語のコーパスを開発・収集・配布しています]
CoRD (Corpus Resource Database) [通時・共時的英語コーパスの情報サイトです]
リスト・コレクション
CQPweb (Lancaster University) [使い方のガイド(動画)がこちらにあります]
CQPweb (CLARIN-D Service Centre, Saarlund University) [Lancaster のCQPweb には含まれていないコーパスがあります]
Mark Davies, 'English-Corpora.org' [多数の大規模ウェブコーパスが集まっています]
Corpora of the Czech National Corpus project [EEBO やOld Bailey Corpus があります。各コーパスの解説はこちら]
Martin Weisser, 'Historical Corpora or Collections (English)'
ツール
VARD 2 [初期近代英語期のテクストのspelling variationに対応するためのソフトウェアです]
AntConc [Laurence Anthony(早稲田大学)開発のコーパス分析用のツールです]
KWIC Concordance for Windows [Helsinki Corpusとセットでよく用いられています]
通史
Helsinki Corpus of English Texts: Diachronic Part [古英語から近代英語までをカバーした、世界最初の英語史コーパスです。ICAMEまたはOTA から入手できます。XML Helsinki Corpus Browser も参照して下さい]
Corpus of Early English Medical Writing (CEEM) [1350 年から1800 年までの医学文献の通時的コーパス(CD-ROM)です。Middle English Medical Texts (MEMT), Early Modern English Medical Texts (EMEMT) and Late Modern English Medical Texts (LMEMT) に分かれています]
Corpus of English Religious Prose (COREP) [1150 年から18 世紀末までの宗教散文の通時的コーパスです(現在編纂中)]
Corpus of Early English Recipes (CoER) [スペインのUniversity of Las Palmas de Gran Canaria で現在編纂中のコーパスです]
Seville Corpus of Northern English (SCONE) [スペインのUniversity of Seville で現在編纂中のコーパスです。600 年から1500 年までの北部英語を対象としています]
LEON: Leuven English Old to New, version 0.3 [Peter Petré (University of Leuven) が編纂したコーパスで、初期古英語から1640 年までをカヴァーしています]
Corpus of Historical English Law Reports (CHELAR) [1535 年から1999 年までの法律文書のコーパスです]
The Salamanca Corpus: Digital Archive of English Dialect Texts [1500 年から1950 年までの通時的方言コーパスです(現在編纂中)]
Transhistorical Corpus of Written English [Edge Hill Universityの研究者が開発した、15世紀から21世紀までの通時的コーパスです]
古英語
Dictionary of Old English Corpus Web Corpus [DOE 編纂のための、現存する古英語文献の包括的なコーパスです。登録をすれば無料で検索できます(※制限つき)]
York-Helsinki Parsed Corpus of Old English Poetry (York Poetry Corpus) [Helsinki Corpus の古英語の韻文作品を構文解析したコーパスです。OTA から入手できます]
York-Toronto-Helsinki Parsed Corpus of Old English Prose (YCOE) [古英語の散文作品を構文解析したコーパスです。OTA から入手できます]
TOXIIC (Trinity Old English from the XIIth Century) [古英語の文献を残した12世紀の写本のコーパスです]
ENHIGLA [古英語と古高地ドイツ語のパラレルコーパスです]
ParCorOEv2 [古英語の一部作品とその現代英語訳のパラレルコーパスです]
中英語
Corpus of Narrative Etymologies (CoNE) [エディンバラ大学で編纂されたコーパスです]
Corpus of Middle English Prose and Verse [中英語の韻文・散文作品146篇の本文検索や電子テキストの閲覧ができます]
Penn-Helsinki Parsed Corpus of Middle English, Second edition (PPCME2) [Helsinki Corpus 収録の中英語散文作品を構文解析したコーパスです]
The Parsed Corpus of Middle English Poetry (PCMEP) [中英語の韻文作品38篇の構文解析コーパスです]
ICAMET (Innsbruck Computer Archive of Machine-Readable English Texts) [中英語の散文作品129篇と、1386 年から1688 年までの書簡254篇のコーパスです]
MEG-C (The Middle English Grammar Corpus) [スタヴァンガー大学で現在編纂中のコーパスです]
A Corpus of Middle English Local Documents (MELD) [同じくスタヴァンガー大学が開発したコーパスです。zipファイルをダウンロードできます]
Corpus of Early English Correspondence (CEEC) [1410 年から1681 年までの書簡のコーパスです]
Corpus of Early English Correspondence Sampler (CEECS) [1418 年から1680 年までの書簡のコーパスです。ICAMEまたはOTA から入手できます]
Corpus of Early English Correspondence Supplement (CEECSU) [CEEC の社会・地域的なギャップを埋める目的で編纂されたコーパスです。1402 年から1663 年までがカヴァーされています]
The Parsed Corpus of Early English Correspondence (PCEEC) [1410 年から1681 年までの書簡の構文解析コーパスです。OTA から入手できます。改訂版がこちらにあります]
The Parliament Rolls of Medieval England [1272 年から1509 年までの英国議会の議事録のコーパスです]
The Málaga Corpus of Late Middle English Scientific Prose [Hunterian Glasgow University Library 所蔵の中英語の写本の解析コーパスです]
初期近代英語
Early English Books Online (EEBO) [1473 年から1700 年の間に英国を中心として刊行された英語文献の全文データベースです(※要登録)。Lancaster のCQPweb からもアクセスできます。EEBO-TCP もご覧下さい]
Penn-Helsinki Parsed Corpus of Early Modern English (PPCEME) [Helsinki Corpus の初期近代英語の部分を拡張・構文解析したコーパスです]
The Penn-York Computer-annotated Corpus of a Large Amount of English (PYCCLE) [Early English Books Online (EEBO) と Eighteenth Century Collections Online (ECCO) の解析コーパスです]
Shakespeare Corpus [Shakespeare の劇37 作と劇中の登場人物の台詞のコーパスです]
A Corpus of English Dialogues, 1560-1760 (CED) [初期近代英語期の対話資料のコーパスです。ICAME から入手できます]
Quaker Historical Corpus [17世紀後半にクエーカーたちによって書かれた文書のコーパスです]
EMMA (Early Modern Multiloquent Authors) Corpus [17世紀生まれの、ロンドンを中心とした作家たちのコーパスです]
Visualizing English Print [初期近代英語のテクストを可視化するツールがついています]
The Lampeter Corpus of Early Modern English Tracts [1640 年から1710 年の間に出版された文献のコーパスです。ICAME またはOTA から入手できます]
Newdigate Newsletters [1674 年から1715 年まで]
Emerging Voices Corpus [初期近代英語の約5万語のコーパスです]
後期近代英語
A Representative Corpus of Historical English Registers (ARCHER) [1650 年から1990 年までのイギリス・アメリカ英語のコーパスです。最新版(ARCHER 3.2)はオンラインで検索できます(※要登録)]
Zurich English Newspaper Corpus (ZEN) [1661 年から1791 年までの英語の新聞記事コーパス(CD-ROM)です]
The Old Bailey Corpus [ロンドンの中央刑事裁判所Old Bailey での議事録(1674~1913)のコーパスです。元となっているOld Bailey Online もご覧下さい]
Rostock Newspaper Corpus [1700年から2000年までのイギリスの新聞記事のコーパスです。RNC-2 が現在編纂中です]
Penn Parsed Corpus of Modern British English (PPCMBE) [1700 年から1914 年までのイギリス英語コーパスです]
A Corpus of Late Modern British and American English Prose (COLMOBAENG) [University of Santiago de Compostela のTeresa Fanego が編纂した、117万語のコーパス(1700~1879)です]
The English language of the north-west in the late Modern English period: A Corpus of late 18c Prose [1761 年から1790 年までの北西部の英語の書簡のコーパス(約30万語)です。OTA から入手できます]
Corpus of Early English Correspondence Extension (CEECE) [CEEC の18 世紀の部分を拡張する目的で編纂されたコーパスです]
Corpus of Late Modern English Texts, version 3.0 (CLMET3.0) [1710年から1920年までの、イギリス英語の母語話者による作品に基づいた、約3400 万語のコーパスです]
Bluestocking Corpus: Letters by Elizabeth Montagu, 1730s-1780s [書簡をウェブ上で閲覧、ダウンロードもできます]
University of Lausanne, The Language of the Labouring Poor in Late Modern England [pauper petition corpus が公開予定です]
Coruña Corpus of English Scientific Writing [Research Group for Multidimensional Corpus-based Studies in English (MuStE) で現在編纂中のコーパスです]
Hansard Corpus [1803 年から2005 年までのイギリス議会における演説のコーパス(16億語)です]
Corpus of English Novels (CEN) [19世紀末・20世紀初頭のイギリス・アメリカ英語の小説のコーパス(2500万語)です]
A Corpus of late Modern English Prose [1861 年から1919 年までの書簡のコーパスです。OTA から入手できます]
University of Birmingham, CLiC Dickens [CLiC というアプリが開発中です]
The Corpus of Nineteenth-Century Newspaper English (CNNE) [19 世紀の英語のコーパスです(現在編纂中)]
HUM19K Corpus [19 世紀のイギリス英語のフィクション作品のコーパス(1300万語)です]
The Diachronic Corpus of Present-Day Spoken English (DCPSE) [ICE-GB (International Corpus of English, British component) とLondon-Lund Corpus に基づいて開発された、口語英語の構文解析通時コーパスです]
APU Writing and Reading Corpus 1979-1988 [イギリスの小学6年生の作文をデータとしたコーパスです]
英語の変種
Corpus of Global Web-Based English (GloWbE) [20カ国の英語のコーパス(約19億語)です]
International Corpus of English (ICE) [各コーパスは1989年以降の話し言葉・書き言葉を含んでいます]
Vienna-Oxford International Corpus of English (VOICE) [リンガ・フランカとしての英語のやり取りを書き起こしたものです。VOICE CLARIAH もご覧下さい]
Freiburg Corpus of English Dialects (FRED) [完全版はフライブルクでのみアクセスできます]
Helsinki Corpus of Older Scots [Middle Scots (1450-1700) のコーパスです。ICAME またはOTA から入手できます]
Corpus of Scottish Correspondence (CSC) [1500~1715 年のスコットランド英語で書かれた書簡のコーパスです]
Corpus of Modern Scottish Writing (CMSW) [1700~1945 年のスコットランド英語のコーパスです]
Scottish Corpus of Texts & Speech (SCOTS) [1945~2007 年のスコットランド英語のコーパスです(400 万語)]
A Corpus of Irish English [14 世紀初頭から現代までのアイルランド英語のコーパスです。Raymond Hickey, Corpus Presenter (John Benjamins, 2003) に付属されています。Irish English Resource Centre も参照して下さい]
The Parsed Old and Middle Irish Corpus (POMIC) [同じくアイルランド英語の解析コーパスです]
The Corpus of Early Ontario English, pre-Confederation Section (CONTE-pC) [Stefan Dollinger (University of British Columbia) が編纂した、カナダ英語の通時的コーパス(約22 万5000 語)です]
Corpus of Oz Early English (COOEE) [1788 年から1900 年までのオーストラリア英語の通時的コーパス(約200 万語)です]
The Diachronic Electronic Corpus of Tyneside English (DECTE) [ニューカッスル大学で現在編纂中のコーパスです]
Corpus of Historical American English (COHA) [1810 年から2009 年までのアメリカ英語の通時的コーパス(約4 億語)です]
Cleaned COHA (CCOHA) [lemma やtoken の修正がなされています]
TIME Magazine Corpus of American English [1923 年から2006 年までのTIME 誌の記事のコーパスです]
The Movie Corpus [1930年代以降の映画から2億語が抽出されています]
Corpus of US Supreme Court Opinions [1790 年代以降の最高裁判所判決文のコーパス(約130万語)です]
Santa Barbara Corpus of Spoken American English [全ての転写をダウンロードできます]
Strathy Corpus of Canadian English [1970年代から2000年代までがカヴァーされています]
Wellington Corpus of Spoken New Zealand English [CDを入手できます]
The Varieties of English for Specific Purposes dAtabase (VESPA) learner corpus [オスロ大学でアクセスできます]