データベース

「闇鍋」について

データベース闇鍋とは

■概要

闇鍋は、現代の短歌俳句川柳を集めたデータベースです。 (多少古典も混じっています。)

このデータ全体は公開していません。

短歌データベースとして出発しましたが、現在は俳句川柳なども入っていて、 語句の使われかたの傾向を見るなど、 評論を書くときの参考として、ものすごい威力を発揮しています。


テキスト検索で、古今の歌人俳人柳人との仮想題詠もできるし、なかなか重宝でもあります。

仮想題詠として使用した例 →「かばん」投稿例


■データ数(2017年3月24日現在)

総数 114,372

内訳 短歌78,155 俳句24,054 川柳その他12,163

(その他とは詩、連歌、俳諧、和讚、都都逸など多様)


■発端

最初はお気に入りの短歌をワープロソフトに入力してためていただけでした。

あるときそれを電子手帳の住所管理ソフトに入れたところ、

北原白秋さんを検索すると白秋さんの歌がぞろっと住所欄に出てくる、

という使用法があることに気づき、その便利さに驚愕。

でも、電子手帳の住所録は500件ぐらいしか入らなかったので、エクセルでの管理に変え、さらに 現在はファイルメーカーproで管理しています。

「闇鍋」を使った初期のエッセー


■データの集め方

1知人友人からコレクションや出版した歌集データを提供してもらう

2ネットから入手(歌人などのホームページ・青空文庫)

3手入力(協力してくださった方もいます)


■偏りなどについて

・私の好みには偏っていない

原則として「選ばずに投げ込む」方針(ゆえに「闇鍋」)なので、私の好みによる偏りはない。

・データの入手しやすさによる偏りがある

知人友人のデータは入手しやすい(所属誌「かばん」メンバーが多い)

ネットにまとまって置いてあるデータは入手しやすい


■まちがいがかなり含まれる

手入力ミスやOCRの読み取り化け、 また出典側の表記ゆれ※。

※一字アケの有無。漢字とひらがな。旧かなと新かな。(特に、「つ」と、つまる「っ」の表記ゆれ。)

パソコンでは出しにくい漢字の代替。漢字ゆれ:「舟」と「船」などの混同。

省略可能な助詞が付いたり消えたり。古歌では濁点の有無。

作者自身が改作。(歌集にまとめるときに、雑誌に発表した歌の表記などを改作することがしばしばある)

というわけで、

「闇鍋」データを使った「仮想題詠」、「勝手に競詠」などからは、安易に引用しないでください。

データは日々確認を重ねておりますが、追いつかない状況です。どこかに引用する場合は、必ずなんらかの方法で表記等を確認してください。


■データ共有・検索サービス

・協力メンバー(「闇鍋メイト」というへんな名前をつけてしまった)はいつでも、最新データ全体を共有できる。

・知人友人には検索サービス(単語検索結果の提供)を行う。

「闇鍋」の全データは「闇鍋メイト」以外には開示しないが、「評論を書くので○○という語を含む歌を集めたい」などの要望があれば知人友人には協力している。


■検索機能を使った活動

評論を書くときに使うのは当たり前ですが、そのほかに次のようなところに使っています。

ワン鍋賞、ニャン鍋賞

単語検索をした結果、たったひとつしか歌句がでてこなかったときに、「ワン鍋賞」としてその旨ツイッタ―でつぶやきます。ニャン鍋賞はふたつしかなかった場合。

・仮想題詠(主にfacebook)

facebookページ「ことばをくすぐれ ふふふふふ」で、同じ単語を使った歌を集め、勝手に競詠させています。

・「かばん」会員向け詠草提出例として使用

「かばん」では会員向けメーリングリストで、メール投稿の例を流しています。

その際、同じ単語を使った歌を集めて例示しています。

→「かばん」投稿例