金で名作は買えない。
5変数予測モデルが暴いた「いい映画」の設計図
監督・脇役・上映時間・予算・ジャンル──5つの変数で映画スコアを予測するモデルを作った。「映画のレシピ」3部作の完結編。
5つの変数で映画の質を予測するモデルを作った。6,650本中、60.7%は±0.5点以内で的中する。そして最も衝撃的な結果──制作費の最適ウェイトはゼロだった。
2本の記事をかけて、映画を「分解」してきた。Vol.4では脇役がいい映画に出ている「品質保証ラベル」であることを示し(SIS)、Vol.5では映画の質を最も支配しているのは監督であることを暴いた(DIS)。パーツの性能テストは済んだ。では──パーツを組み合わせたら、映画の「当たり」を事前に予測できるのか?
映画スタジオにとって、これは聖杯のような問いだ。ハリウッドではメジャースタジオの1本あたり平均制作費が$100Mを超え、マーケティング費を含めれば$200M以上になる。年間50本以上のメジャー作品が世に出て、そのうち黒字になるのは半分程度。この巨額投資の成否を公開前に予測できたら──それは文字通り「黄金の方程式」になる。
脚本家ウィリアム・ゴールドマンは、ハリウッドの本質をこう喝破した。「Nobody knows anything(誰も何も分かっちゃいない)」。『明日に向って撃て!』と『大統領の陰謀』で2度のアカデミー脚本賞を獲った男が、業界の内側から出した結論がこれだった。制作費をいくらかけても、スターを何人揃えても、当たるかどうかは分からない──と。
40年間、この名言は「映画ビジネスの真理」として引用され続けてきた。だが本当にそうか? Vol.4と5で蓄積した「人」のデータに上映時間・予算・ジャンルを加えた5変数モデル──MSS(Movie Structure Score)──を構築して、ゴールドマンの名言に挑んでみよう。
5つの変数で映画の「当たり」はどこまで予測できるのか?
Vol.4で脇役のSIS、Vol.5で監督のDISを定義した。ここに上映時間・制作費・ジャンルの3変数を加え、5変数の合成スコア「MSS」を構築する。各変数をz正規化(平均0、標準偏差1に揃える)した上で、ウェイトをかけて合算する。
DISのウェイトが最大なのは、Vol.5の分散分析が根拠だ。監督のDIS分散(0.339)は主演俳優(0.199)の1.7倍、脇役(0.153)の2.2倍──つまり映画の質を最も大きく「動かす」変数だった。SISが25%なのも同様に、脇役の出演実績がスコアと中程度の相関を持つため。
上映時間(15%)はVol.3で検証済み──長い映画ほどスコアが高い傾向がある。これは「長い映画は制作にリソースが投入されている」ことの代理変数だ。ジャンル(10%)はジャンル間の平均スコア差を反映する。
そして予算(10%)。映画制作で最も注目される数字だ。制作費$200Mの大作は、$10Mのインディーズより質が高いのか? この「常識」をデータに検証させる。
モデルを作ったら、まず「本当に機能するのか」を検証する。6,650本をMSSの高い順に5等分し、各グループの実際の平均スコアを比較した。MSSが意味のある指標なら、上位グループほどスコアが高いはずだ。
結果は明快だった。MSSが上がるにつれ、実際のスコアもきれいな階段状に上昇する。最上位(Q5)の平均★7.17は「いい映画」と呼べる水準。最下位(Q1)の★5.69は全体平均を大きく下回る。モデルは確かに「当たりやすい映画」と「外れやすい映画」を分離できている。
特筆すべきは、Q4→Q5の跳ね上がり(+0.40)だ。Q1→Q2(+0.51)に次いで大きい。「上位20%」に入るかどうかが、映画の質を分けるクリティカルラインであることを示唆している。
ただし注意──これは「グループの平均」であって、個別の映画を正確に当てられるかは別の問題だ。Q5の中にも外れはあるし、Q1にも名作は埋もれている。次のDATAで「1本ごとの的中率」を検証する。
MSSから線形回帰で予測スコアを算出し、実際のスコアとの誤差を計測した。的(まと)に見立てて、中心ほど「的中」だ。
±0.5点以内の的中率60.7%──つまり10本中6本はほぼ当たる。これは意味のある数字だ。映画10本のうち6本の質を、「誰が撮ったか」「誰が出ているか」「何分か」「どのジャンルか」だけで予測できる。
±1.0点以内に広げれば90.2%。壊滅的なハズレ──モデルが★7.0を予測したのに実際は★4.0だったような事態──は極めてまれだ。MSSは「映画の質の大まかな輪郭」を描ける。
しかし残り39.3%は外れる。平均絶対誤差0.48点は「だいたい合っている」が「完璧には程遠い」。ゴールドマンの「Nobody knows anything」は間違いだった。だが「Everybody knows 60%」が正しかったかと言えば、残りの40%こそが映画を「予測可能な商品」ではなく「予測不能な芸術」にしている。
5つの変数は「平等」ではない。各変数の単独での予測力(相関係数r)をドットチャートで比較する。右に行くほど、その変数だけで映画スコアを予測できる力が強い。
DIS単独のr=0.612は、5変数フルモデルr=0.666の92%に相当する。「監督が誰か」を知るだけで、映画の質はほぼ予測できる──Vol.5の結論がここでも裏付けられた。
SIS(r=0.532)を加えると、DIS+SISの2変数でr=0.667。なんと5変数フルモデルとほぼ同じだ。上映時間・予算・ジャンルの3変数は、「人」の情報が揃った後ではほとんど追加の予測力を持たない。
そして制作費のr=0.089。これはほぼ「ノイズ」と言っていい。$200Mかけた映画も$10Mの映画も、品質に有意な差がない。映画産業が最も重視する数字が、最も予測力のない変数だった──次のDATAで、この衝撃をさらに掘り下げる。
5つのウェイトを最適化したらどうなるか。DIS:40%、SIS:25%…の初期設定を、グリッドサーチ(全組み合わせ探索)で最適化する。
グリッドサーチの結果は明快だった。予算のウェイトをゼロにしたとき、モデルの精度が最も高くなる。制作費を考慮に入れると、むしろノイズが増えて予測がブレるのだ。
最適化後のウェイトは、DIS:45% + SIS:30% + Runtime:15% + Genre:10%。「人」の2変数(DIS+SIS)で全体の75%を占める。映画の質を決めているのは、金でも設備でもなく、誰が撮って、誰が出ているか──これが3部作の結論だ。
もちろん「制作費が無意味」という話ではない。制作費は視覚効果やロケーションの質を上げ、興行収入には貢献する。だがVol.2で示した通り、興行収入と評価スコアの相関はr=0.21。「売れる」と「いい」は別の話であり、制作費は「売れる」側の変数に過ぎない。
理論は分かった。では具体的に──MSSは有名映画の質をどれだけ当てられるのか。10本の名作・話題作について、MSS予測 vs 実際のスコアを並べてみよう。
インターステラー(+0.5)とトランスフォーマー(-0.1)──MSSが最も正確に予測した2本は、対照的な映画だ。ノーラン監督のDISが高く上映時間も長いインターステラーは「構造的に良い映画」の典型。トランスフォーマーは「構造的に平凡な映画」の典型。どちらもモデルの想定通りだった。
一方、ゴッドファーザー(+1.4)とフォレスト・ガンプ(+1.5)はMSSを大きく超えた。コッポラのDISは高いが、ゴッドファーザーの★8.7はDISだけでは説明できない「何か」──脚本の完璧さ、マーロン・ブランドの存在感、1972年のアメリカが求めた物語──が加わっている。
逆に、MSSが実際より高く予測してしまう映画もある。キャッツ(2019年)は実際★4.1に対しMSS予測は★7.0。トム・フーパー監督のDIS、ジュディ・デンチやイアン・マッケランの脇役SIS──「構造」は完璧だった。しかし映画は壊滅した。構造では測れない「実行の質」が、ここでは致命的に欠けていた。
MSSが予測できる60%と、できない40%。この境界線はどこにあるのか。MSSの「中身」と「外」を整理する。
脚本の質──MSSに含まれない最大の変数だ。MSSは「誰が撮ったか」は知っているが「何を書いたか」は知らない。『ゴッドファーザー』と『ゴッドファーザーPART III』は同じ監督だが、脚本の質が違う。データベースに「脚本の良さ」を数値化したフィールドはない。
俳優のケミストリー──個々の俳優のSISは測れても、「この2人が共演すると化学反応が起きる」は測れない。デ・ニーロとパチーノの共演は2人のSISの合計以上の何かを生む。これは構造変数では捉えられない創発的な現象だ。
時代との共鳴──『パラサイト』が2019年に世界を席巻したのは、格差社会への関心がピークに達していたからだ。同じ映画が2005年に公開されていたら、同じ反響があっただろうか。時代の空気は事後的にしか分析できない。
そして実行の質。同じ監督でも、体調、予算配分のミス、撮影中のトラブルで「いつもの水準」を下回ることがある。キャッツのトム・フーパー監督は、直前作『リリーのすべて』で★7.1を記録していた。構造は完璧でも実行が伴わなければ──それが40%の正体の一部だ。
最大の変数は「誰が撮るか」であり、
最小の変数は「いくらかけるか」だった。
そして方程式が予測できない40%こそが、
映画を「製品」ではなく「作品」にしている。
3部作を振り返ろう。Vol.4のSIS分析は「名脇役は品質保証ラベルである」と結論づけた。Vol.5のDIS分析は「品質を設計しているのは監督である」と暴いた。そしてVol.6のMSSモデルは、この2つの「人的変数」が映画の質の75%を説明することを示した。映画とは、煎じ詰めれば「人」なのだ。
予算のウェイトがゼロだったことは、映画産業の構造を鋭く照射する。スタジオは「制作費$200M」を売り文句にするが、データはそれが品質と無関係であることを示す。金は視覚効果やマーケティングを買えるが、「いい映画」は買えない。いい映画は「いい人」──具体的にはDISの高い監督とSISの高い脇役──から生まれる。
ゴールドマンの「Nobody knows anything」に対するデータの回答は、こうだ。「We know 60%. And the other 40% is what makes it art.」 60%は構造で予測できる。監督の実績、脇役の質、上映時間、ジャンル──これらの「骨格」で映画の輪郭は描ける。だが傑作をデータから生み出すことはできない。ゴッドファーザーの脚本、デ・ニーロとパチーノのケミストリー、パラサイトと時代の共鳴──残り40%は、データの外にある人間の創造性だ。
この構造は映画だけの話ではない。ゲーム業界では宮本茂(マリオの生みの親)のディレクション力が任天堂の質を支配し、広告業界ではクリエイティブ・ディレクターが作品の質を決める。「創造的産業において、品質を決定するのは資本ではなくキーパーソンである」──MSSモデルが映画のデータから導いたこの法則は、あらゆるクリエイティブ産業に適用できる構造的真理だ。
「原作あり」vs「オリジナル」で脚本力は測れるか?
映画分析シリーズ Vol.6 ── 金で名作は買えない。
データ出典: TMDB(The Movie Database)





