アメリカ 叙任演説を、
”america”、”citizen”、"war"で始まる単語の数を自然言語処理系NLTKを使ってプロットします。
叙任演説の長さによる正規化は行っていません。
nltkコマンド
>>> import nltk
>>> from nltk.corpus import inaugural
>>> cfd = nltk.ConditionalFreqDist(
... (target, fileid[:4])
... for fileid in inaugural.fileids()
... for w in inaugural.words(fileid)
... for target in ['america', 'citizen', 'war']
... if w.lower().startswith(target))
>>> cfd.plot()
条件付き頻度分布図
1841年、やたら"citizen"の頻度が高いですね
なんでだろって思い、wikiで調べると面白い結果が分りました。
以下、wikipediaからの抜粋(原文ママ)
ハリソンが就任宣誓を行なった1841年3月4日は非常に寒く風が強い日だった。
しかしハリソンはコートを着用せず、ほぼ二時間近いアメリカ史上で最長の就任演説を行った。
これでハリソンは風邪を引き、それで肺炎へこじらせ、一ヶ月後に死去した。
ハリソンは在職中に死去した初の大統領であり、また任期が最短(31日)大統領である。
ハリソンの死去に伴い副大統領ジョン・タイラーが大統領に昇格した。
ハリソンという大統領がやたら長い叙任演説をやったせいで、citizenの頻度が他と比べて高いのでしょうか?
というか、叙任演説をやって肺炎になり、一ヶ月後に死んだなんて、なんだかなぁという感じです。
1921年付近、"war"と、"america"の頻度がともに高いです。
この当時、アメリカは、狂乱の20年代と呼ばれ、経済、社会的に大きく発展した時代です。
その後、1945年以降、americaの頻度が歴代と比較して絶対的に高くなっていってるのは、
覇権国家としての道を歩んだ結果でしょうか?