英語史関連の研究リソース(電子テキストやコーパス)やコンコーダンサーなどのツールについて情報をまとめています。
作成途中、随時更新しています。順序や項目の入れ替えなどがあるかもしれません。
電子テキストやリソース
電子テキストの入手について
テキスト調査型のリサーチを行う際には、対象作品の電子テキストを入手することができるかどうかについて調べましょう。電子テキストがあれば、コンコーダンサーなどを活用して用例の検索や抽出を行うことができます。
さまざまな電子テキストのリポジトリとして最も有名なのはOxford Text Archive (OTA)です。また、Historical Corpora in the CLARIN infrastructureも参照してみてください。古英語に関しては、後述していますが、2000年度版DOECはOTAからダウンロード可能です。
基本的に電子テキストの入手は以下が候補になると思います。
- 中英語
- 初期近代英語(EEBO-TCP Phase 1, Phase 2)
- EarlyPrint
- EarlyPrint Library
- EarlyPrint Lab(Download Text and Metadataから検索可能)
- Early English Books Online Collections (EEBO)(ミシガン大学)
- EarlyPrint
全般
古英語
- Dictionary of Old English (DOE)
- Dictionary of Old English Corpus (DOEC)
- OTAのDictionary of Old English Corpus in Electronic Form (DOEC)
- DOECの2000年度版であればOTAからダウンロード可能です。
中英語
- A Linguistic Atlas of Early Middle English (LAEME)
- A Linguistic Atlas of Late Medieval English (eLALME)
初期近代英語
- EarlyPrint
- EarlyPrint Library
- EarlyPrint Lab
- Tutorials and How-Tos
- NUPOS Tag Set(品詞タグ)
- EarlyPrintで使用されている品詞タグの仕様はCLAWS7とは異なります
- NUPOS Origins and Principles
初期近代英語の研究リソースについては「デジタル・ヒューマニティーズにおける初期近代英語の研究リソース : EEBOを中心に据えた新しい類型の提示」(菊地・矢冨・高橋 2024)にも目を通してみて下さい。
後期近代英語
現代英語
コンコーダンサー
- AntConc (Windows/Mac/Linux)
- #LancsBox X (Windows/Mac/Unix)
- CasualConc (Mac)
- Voyant Tools (Online)
コーパスに関する情報サイト
前提として、リサーチクエスチョンに対して「コーパスの使用が適切かどうか?」を考えるところから始まると思います。そして、コーパスでリサーチを行う場合には、まずどのようなコーパスが利用可能か知る必要があります。無償で利用可能なコーパスが多いのですが、登録が必要だったり、編纂者に連絡を取る必要がある場合もあります。また、一部分しか一般公開されていないコーパスもあります。
コーパスに関する情報はヘルシンキ大学の研究チームVARIENGがまとめているポータルサイトCoRDが有益です。
三浦あゆみ先生(東京大学)によるA Gateway to Studying HELのCorporaも参照してみましょう。有益な情報が詰まっています。
また、菊地翔太先生(専修大学)のウェブサイトにも学生向けにコーパスとそれに関連する豊富な情報が掲載されていますので、参照してみましょう。Lindquist & Levin (2018) に関係付ける形で情報が掲載されています。
オンラインコーパス
共通インターフェイスのコーパス群
非常によく使用されるコーパス群の一つはEnglish-Corpora.orgです。多くのコーパスを利用することができます。インターフェイスが共通のため、一度使い方を覚えれば、ある程度は流用することができるのも利点です。登録が必要かつ24時間あたりの検索回数に制限が設けられています。サブスクリプションに入ることで制限を緩和することもできます。
- English-Corpora.org(Mark Davies氏)
また、CQPwebというコーパスを検索するための共通インターフェイスも存在します。異なる大学がCQPwebを導入してそれぞれ異なるコーパスを導入、提供しています。以下に2つ紹介します。
- CQPweb at Lancaster(ランカスター大学)
- ランカスター大学によるAndrew Hardie氏が管理しているコーパス群です(要登録)。権利の関係上、全てが利用可能なわけではありませんが、一般登録でも研究に利用可能なコーパスが多数含まれています。
- 登録時には外大から発行されたメールアドレスを使用して下さい。
- CQPweb at Saarlund University(ザールラント大学)
- 同じCQPwebを利用したコーパス群をザールラント大学も一般向けに提供しています(要登録)。ランカスター大学とは利用可能なコーパスが異なります。
- 登録時には外大から発行されたメールアドレスを使用して下さい。登録メールアドレスによって利用可能なコーパスが変わってくるとの注意書きがあります。
品詞タグについて
OEDやMEDの引用文
いわゆるコーパスとしての利用が最初から想定されているわけではありませんが、OEDやMEDの引用文の集成体をコーパスとして見立ててリサーチに活用する場合もあります。この点については、家入 & 堀田(2023) を参照してください。