映画は口が悪くなったが、心は変わっていない。
13,497本の字幕データが示す「きれいな言葉」の70年
Fワードは12倍に増えた。では映画の「感情の言葉」はどう変わったのか。正と負、2つの語群で映画の心を測る。
13,497本の字幕を分析した結果、映画は「kill」より「love」を2.72倍多く使っていた。Fワードが12倍に増えた70年間、この比率はほぼ変わっていない。
Vol.8で、映画のFワードが70年で12倍に増えたことを示した。映画の口はどんどん悪くなっている。あの記事を読んだ人の多くは、こう感じたかもしれない。「映画はどんどん荒っぽくなっているのでは?」と。
しかし、口の悪さだけで映画の「心」を測ることはできない。Fワードが増えたのは事実だ。だが同時に、映画は「love」も「thank」も「hope」も言い続けている。汚い言葉が増えたからといって、きれいな言葉が減ったとは限らない。
今回は13,497本の英語字幕データから、30の「正の言葉」(love, thank, happy, hope...)と25の「負の言葉」(kill, dead, hell, gun...)を抽出し、映画の「感情のバランス」を計測した。映画は本当に暗くなっているのか? それとも口が悪くなっただけで、心は変わっていないのか?
この記事では、ジャンル別の感情プロファイル、70年間のトレンド、そして「きれいな言葉が多い映画は本当にいい映画なのか」という問いに、データで答える。
では、「きれいな言葉」はどうなったのか?
映画の言葉は「光」が支配している。13,497本の字幕データから抽出した正の言葉(love, thank, happy, hopeなど30語)は合計385,815回。負の言葉(kill, dead, hell, gunなど25語)は141,932回。正の言葉は負の2.72倍だった。
映画は暴力的な印象があるかもしれないが、字幕データが示す実態は逆だ。3本に2本の映画は、暗い言葉より明るい言葉を多く使っている。正の言葉のトップは「love」(102,049回)、次いで「thank」(94,540回)、「great」(51,715回)。負の言葉では「hell」(29,302回)、「kill」(22,461回)、「dead」(19,613回)が上位に並ぶ。
もちろん、これは映画が常にポジティブだという意味ではない。重要なのは「平均的な映画は、暗い言葉よりも明るい言葉のほうが多い」という構造的事実だ。では、このバランスはジャンルによってどれほど違うのか。
ジャンルは「言葉の色」で分かれる。各ジャンルの映画が使う正の言葉と負の言葉の密度を比較すると、驚くほど明確なスペクトラムが現れる。
スペクトラムの一端にロマンスがいる。正語密度0.611%に対し負語密度はわずか0.074%。8倍以上の差は、ジャンルの定義そのものが言葉に刻まれていることを意味する。音楽映画(7.39倍)、ファミリー映画(7.87倍)がこれに続く。
反対の端には西部劇(0.47倍)と戦争映画(0.67倍)がいる。負の言葉が正を上回る、数少ないジャンルだ。アクション映画も0.75倍と、負が優勢。そして興味深いのはホラーの0.96倍。正と負がほぼ拮抗し、最も「バランスの取れた」感情語彙を持つジャンルだ。恐怖を描くためには、希望も同時に必要なのかもしれない。
ここで浮かぶ疑問がある。Fワードが12倍に増えた70年間、この感情バランスはどう変化したのか。
Fワードは70年で0から2.52/千語に急増した。しかし正と負の言葉のバランスは、ほとんど動かなかった。
視覚的に一目瞭然だ。Fワードの黄色い線だけが急上昇し、正と負の2本の線はほぼ平行のまま。1950年代の映画は千語あたり正の言葉3.1回、負の言葉1.0回。2015年代は正3.7回、負1.4回。70年かけて正は20%増、負は40%増にとどまる。一方でFワードは0から2.52に急増した。
(なお各5年区間のサンプル数は1950年n=227〜2010年n=2,838と近年ほど多い。初期の数値は標本が小さいため振れ幅が大きい点に注意)
この発見はVol.8の結論と美しく接続する。映画の「口」は確かに汚くなった。しかし「心」は変わっていなかった。Fワードの増加はレーティング制度の変化やジャンルの多様化によるものであり、映画の根底にある感情のバランスとは別の現象だったのだ。
正の言葉のバランス指標(正の割合)は1950年代の0.654から2010年代の0.645へ。70年間、ほぼ65%前後で横ばい。映画は一貫して「3分の2が光、3分の1が影」という配分で物語を紡いでいる。
映画で最も多く使われる正の言葉は「love」。102,049回の出現は2位「thank」の94,540回を約8%上回る。だが映画数では逆転する。
「love」は出現回数こそ最多だが、1本の映画で大量に使われる傾向がある(ロマンスやミュージカル)。「thank」はどのジャンルにも満遍なく登場するため、映画数では上回る。3位以下はgood、nice、kind、believe、family、friend、happy、bestと続く。
ジャンル別に見ると、「love」密度が最も高いのは意外にも音楽映画(千語あたり2.24回)で、ロマンス(2.07回)を上回る。コメディ(1.31回)、ドラマ(1.13回)がこれに続き、アクション(0.40回)、SF(0.44回)、西部劇(0.32回)は低い。「love」という一語だけでも、ジャンルの輪郭が見えてくる。
ここまでの発見を踏まえて、最も重要な問いに答える。「きれいな言葉が多い映画は、いい映画なのか?」
答えは「No」だ。正の言葉とスコアの相関は r=0.017。統計的には「無関係」と言っていい。一方で負の言葉は r=-0.121と弱いながら有意な負の相関を示す。暗い言葉が多い映画ほど、スコアが低い傾向がある。
さらに興味深いのはスコア帯別のパターンだ。正の言葉はスコア5-6帯(凡作ゾーン)でピークし、最高スコア帯(8+)ではむしろ減少する。名作は言葉で感情を直接語るのではなく、映像や演技で伝えるからかもしれない。
これはVol.8のFワード分析と同じ構造だ。Fワードもスコアと無関係だった(回帰分析で二次項p=0.23、非有意)。正の言葉も、Fワードも、映画の品質を決めない。品質は別の場所──監督や脚本──で決まっている(Vol.5, Vol.6で検証済み)。
名作は言葉のバランスで見ると、きわめて多様だ。字幕データがある有名映画の正/負語密度を比較すると、一つのパターンに収まらないことが分かる。
インセプションは正語0.56%、負語0%──純粋に「光の言葉」だけで構築された作品。ゴッドファーザーも犯罪映画ながら正語が優勢(0.41% vs 0.00%)。一方でセブンは正0.13%に対し負0.45%で、暗い言葉が3.5倍。ファイト・クラブも同様に負が優勢。
フォレスト・ガンプは正0.31%、負0.29%とほぼ拮抗。人生の光と影を等しく描く作品らしいバランスだ。ダークナイトは「ダーク」の名に反して正が負の1.5倍(0.21% vs 0.14%)。ヒーロー映画である以上、希望は必要なのだ。
このデータが示すのは「いい映画の言葉に型はない」ということ。ポジティブだろうがネガティブだろうが、名作は成立する。品質を決めるのは言葉の正負ではなく、別の何かだ。
最後に、回帰分析で感情語と品質の関係を数値化する。正語密度と負語密度の2変数でスコアを予測すると、R²=0.015。品質の1.5%しか説明できない。
正語の回帰係数は-0.004。ゼロに等しい。正の言葉を増やしても減らしても、スコアは動かない。一方、負語の係数は-0.045。千語あたり負の言葉が1語増えるごとにスコアが約0.045点下がる。小さな効果だが、方向は明確だ──暗い言葉は品質を下げる方向に働き、明るい言葉は品質に影響しない。
この非対称性は行動経済学の「損失回避」に似ている。ネガティブな情報はポジティブな情報よりも強い影響を持つ。映画の言葉にも同じ構造がある。「love」を100回言っても映画は良くならないが、「kill」を多用すれば悪くなりうる。
ただし、R²=0.015という数字が最も重要だ。感情語で映画の品質を予測することは、事実上不可能。品質を決めるのは「何を言うか」ではなく「どう語るか」であり、それは字幕の単語カウントでは捉えられない領域にある。Vol.5-6で示した通り、最大の変数は「誰が撮るか」(DIS)だった。
そして「きれいな言葉」は映画を良くも悪くもしない。品質は、言葉の外で決まっている。
映画の感情バランスが70年間ほぼ不変だったという事実は、映画というメディアの構造的安定性を示している。Fワードの急増(Vol.8)やアクション映画の台頭といった表面的な変化の下で、物語の骨格──光と影のバランス──はほとんど揺らいでいなかった。
正の言葉が品質と無関係で、負の言葉が弱いながら負の相関を持つという非対称性にも構造的な理由がある。正の言葉(love, happy, hope)はあまりに普遍的で、どんな映画にも登場する。差別化力がない。一方、負の言葉(kill, dead, gun)はジャンルと強く結びつき、そのジャンル自体がスコアの偏りを持つ(アクション=低め、ドラマ=高め)。感情語は品質の原因ではなく、ジャンルのマーカーだった。
この結論はVol.8のFワード分析と完全に一致する。Fワードも品質と無関係だった。見かけのU字型パターンはジャンル交絡によるもので、ジャンルを統制すると消失した。正の言葉も、負の言葉も、Fワードも、すべて「何を語るか」の指標であり、「どう語るか」の指標ではない。
この分析が証明しないことも明確にしておく。字幕の単語カウントは文脈を捉えない。「I love you」と「I'd kill for that」の感情的重みの違いは、単語頻度では測定できない。また、字幕は台詞のみであり、映像・音楽・演技という映画の大部分は含まれない。1.5%という説明力の低さは、品質が言語以外の領域で決まることの証左でもある。
しかし確実に言えることがある。映画の「心」は変わっていない。1950年代も2010年代も、映画は約65%が光、35%が影で構成されている。口は汚くなったかもしれないが、物語が伝えようとする感情のバランスは、驚くほど安定しているのだ。
──勝率26%の真実を、データで検証する。
映画分析シリーズ Vol.9 ── 映画は口が悪くなったが、心は変わっていない。
データ出典: TMDB(The Movie Database)+ OpenSubtitles字幕データ|分析日: 2026年2月
分析対象: 英語字幕付き映画13,497本(投票50件以上、1950〜2019年)
このデータは字幕の単語カウントに基づく分析であり、文脈・映像・音楽は含みません。





