映画分析 Vol.6

金で名作は買えない。
5変数予測モデルが暴いた「いい映画」の設計図

監督・脇役・上映時間・予算・ジャンル──5つの変数で映画スコアを予測するモデルを作った。「映画のレシピ」3部作の完結編。

🎬 全ジャンル📊 TMDB📅 2026.2.21

5つの変数で映画の質を予測するモデルを作った。6,650本中、60.7%は±0.5点以内で的中する。そして最も衝撃的な結果──制作費の最適ウェイトはゼロだった。

2本の記事をかけて、映画を「分解」してきた。Vol.4では脇役がいい映画に出ている「品質保証ラベル」であることを示し（SIS）、Vol.5では映画の質を最も支配しているのは監督であることを暴いた（DIS）。パーツの性能テストは済んだ。では──パーツを組み合わせたら、映画の「当たり」を事前に予測できるのか？

映画スタジオにとって、これは聖杯のような問いだ。ハリウッドではメジャースタジオの1本あたり平均制作費が$100Mを超え、マーケティング費を含めれば$200M以上になる。年間50本以上のメジャー作品が世に出て、そのうち黒字になるのは半分程度。この巨額投資の成否を公開前に予測できたら──それは文字通り「黄金の方程式」になる。

脚本家ウィリアム・ゴールドマンは、ハリウッドの本質をこう喝破した。「Nobody knows anything（誰も何も分かっちゃいない）」。『明日に向って撃て!』と『大統領の陰謀』で2度のアカデミー脚本賞を獲った男が、業界の内側から出した結論がこれだった。制作費をいくらかけても、スターを何人揃えても、当たるかどうかは分からない──と。

40年間、この名言は「映画ビジネスの真理」として引用され続けてきた。だが本当にそうか？ Vol.4と5で蓄積した「人」のデータに上映時間・予算・ジャンルを加えた5変数モデル──MSS（Movie Structure Score）──を構築して、ゴールドマンの名言に挑んでみよう。

🍿 Snack ゴールドマンの「Nobody knows anything」は1983年の著書『Adventures in the Screen Trade』で書かれた。以来40年、これはハリウッドで最も引用されるフレーズになった。皮肉なことに、この本自体が脚本料以上にゴールドマンの名声を確立した──つまり彼は「何も分からない」と書くことで、最も確実に稼いだのだ。

監督、脇役、上映時間、予算、ジャンル──
5つの変数で映画の「当たり」はどこまで予測できるのか？

ANALYSIS TARGET

TMDBスコア（10点満点）× 5変数構造モデル

対象映画

6,650

使用変数

相関係数

r=0.666

指標

MSS（5変数合成スコア）

対象

投票50件以上 × 5変数完備

比較方法

線形回帰（z正規化後）

モデル

DIS 40% + SIS 25% + 他3変数

DATA 01 ── MSSモデルの設計図

Vol.4で脇役のSIS、Vol.5で監督のDISを定義した。ここに上映時間・制作費・ジャンルの3変数を加え、5変数の合成スコア「MSS」を構築する。各変数をz正規化（平均0、標準偏差1に揃える）した上で、ウェイトをかけて合算する。

MSS（Movie Structure Score）の構成

5変数のウェイト配分（初期設定）

MSS = DIS(40%) + SIS(25%) + Runtime(15%) + Budget(10%) + Genre(10%)

DIS

40%

SIS

25%

Runtime

15%

Budget

10%

Genre

10%

📌 監督（DIS）が全体の40%を占める。「映画のレシピ」の主成分は、カメラの後ろにいる人だ

z正規化により、スケールの異なる変数（上映分数と制作費$）を同じ尺度で比較可能にした。

DISのウェイトが最大なのは、Vol.5の分散分析が根拠だ。監督のDIS分散（0.339）は主演俳優（0.199）の1.7倍、脇役（0.153）の2.2倍──つまり映画の質を最も大きく「動かす」変数だった。SISが25%なのも同様に、脇役の出演実績がスコアと中程度の相関を持つため。

上映時間（15%）はVol.3で検証済み──長い映画ほどスコアが高い傾向がある。これは「長い映画は制作にリソースが投入されている」ことの代理変数だ。ジャンル（10%）はジャンル間の平均スコア差を反映する。

そして予算（10%）。映画制作で最も注目される数字だ。制作費$200Mの大作は、$10Mのインディーズより質が高いのか？この「常識」をデータに検証させる。

DATA 02 ── 五分位テスト：MSSは機能するか

モデルを作ったら、まず「本当に機能するのか」を検証する。6,650本をMSSの高い順に5等分し、各グループの実際の平均スコアを比較した。MSSが意味のある指標なら、上位グループほどスコアが高いはずだ。

MSS五分位別・実際の平均スコア

6,650本をMSS順に5等分。各グループ1,330本

📌 MSS上位20%の映画は平均★7.17、下位20%は★5.69。スコア差1.48ポイント

MSSが高い映画ほど、実際のスコアも高い。モデルは「機能している」。

結果は明快だった。MSSが上がるにつれ、実際のスコアもきれいな階段状に上昇する。最上位（Q5）の平均★7.17は「いい映画」と呼べる水準。最下位（Q1）の★5.69は全体平均を大きく下回る。モデルは確かに「当たりやすい映画」と「外れやすい映画」を分離できている。

特筆すべきは、Q4→Q5の跳ね上がり（+0.40）だ。Q1→Q2（+0.51）に次いで大きい。「上位20%」に入るかどうかが、映画の質を分けるクリティカルラインであることを示唆している。

ただし注意──これは「グループの平均」であって、個別の映画を正確に当てられるかは別の問題だ。Q5の中にも外れはあるし、Q1にも名作は埋もれている。次のDATAで「1本ごとの的中率」を検証する。

DATA 03 ── 的中率：60%の壁

MSSから線形回帰で予測スコアを算出し、実際のスコアとの誤差を計測した。的（まと）に見立てて、中心ほど「的中」だ。

MSS予測の的中精度

中心に近いほど予測が正確。6,650本の結果

📌 10本中6本は±0.5点以内で的中。90%は±1.0点以内に収まる

ただし10本中4本はズレる──そこに映画の「芸術性」がある。

±0.5点以内の的中率60.7%──つまり10本中6本はほぼ当たる。これは意味のある数字だ。映画10本のうち6本の質を、「誰が撮ったか」「誰が出ているか」「何分か」「どのジャンルか」だけで予測できる。

±1.0点以内に広げれば90.2%。壊滅的なハズレ──モデルが★7.0を予測したのに実際は★4.0だったような事態──は極めてまれだ。MSSは「映画の質の大まかな輪郭」を描ける。

しかし残り39.3%は外れる。平均絶対誤差0.48点は「だいたい合っている」が「完璧には程遠い」。ゴールドマンの「Nobody knows anything」は間違いだった。だが「Everybody knows 60%」が正しかったかと言えば、残りの40%こそが映画を「予測可能な商品」ではなく「予測不能な芸術」にしている。

DATA 04 ── 変数の格差

5つの変数は「平等」ではない。各変数の単独での予測力（相関係数r）をドットチャートで比較する。右に行くほど、その変数だけで映画スコアを予測できる力が強い。

各変数の単独予測力

破線は5変数フルモデル（r=0.666）の参考ライン

📌 DIS単独（r=0.612）で5変数モデル（r=0.666）の92%の予測力を持つ

DIS+SISの2変数だけで r=0.667。5変数フルモデルとほぼ同じ。「人」だけで予測できる。

DIS単独のr=0.612は、5変数フルモデルr=0.666の92%に相当する。「監督が誰か」を知るだけで、映画の質はほぼ予測できる──Vol.5の結論がここでも裏付けられた。

SIS（r=0.532）を加えると、DIS+SISの2変数でr=0.667。なんと5変数フルモデルとほぼ同じだ。上映時間・予算・ジャンルの3変数は、「人」の情報が揃った後ではほとんど追加の予測力を持たない。

そして制作費のr=0.089。これはほぼ「ノイズ」と言っていい。$200Mかけた映画も$10Mの映画も、品質に有意な差がない。映画産業が最も重視する数字が、最も予測力のない変数だった──次のDATAで、この衝撃をさらに掘り下げる。

DATA 05 ── 予算の項はゼロだった

5つのウェイトを最適化したらどうなるか。DIS:40%、SIS:25%…の初期設定を、グリッドサーチ（全組み合わせ探索）で最適化する。

ウェイト最適化：初期設定 → グリッドサーチ結果

5変数のウェイトを5%刻みで全探索し、最も相関の高い組み合わせを特定

BEFORE（初期設定 r=0.666）

DIS

40%

SIS

25%

Runtime

15%

Budget

10%

Genre

10%

AFTER（最適化後 r=0.684）

DIS

45%

SIS

30%

Runtime

15%

Budget

Genre

10%

📌 予算の最適ウェイトはゼロ。75%が「人」（DIS+SIS）に集中した

金で名作は買えない──データが証明した。

グリッドサーチの結果は明快だった。予算のウェイトをゼロにしたとき、モデルの精度が最も高くなる。制作費を考慮に入れると、むしろノイズが増えて予測がブレるのだ。

最適化後のウェイトは、DIS:45% + SIS:30% + Runtime:15% + Genre:10%。「人」の2変数（DIS+SIS）で全体の75%を占める。映画の質を決めているのは、金でも設備でもなく、誰が撮って、誰が出ているか──これが3部作の結論だ。

もちろん「制作費が無意味」という話ではない。制作費は視覚効果やロケーションの質を上げ、興行収入には貢献する。だがVol.2で示した通り、興行収入と評価スコアの相関はr=0.21。「売れる」と「いい」は別の話であり、制作費は「売れる」側の変数に過ぎない。

DATA 06 ── 名作スコアカード

理論は分かった。では具体的に──MSSは有名映画の質をどれだけ当てられるのか。10本の名作・話題作について、MSS予測 vs 実際のスコアを並べてみよう。

MSS予測 vs 実際のスコア

■ 的中（±0.5以内） ■ やや過小評価 ■ 大きく過小評価

ゴッドファーザー

実際

8.7

予測

7.2

+1.5 過小評価

フォレスト・ガンプ

実際

8.5

予測

7.0

+1.5 過小評価

ショーシャンクの空に

実際

8.7

予測

7.4

+1.3 過小評価

マトリックス

実際

8.2

予測

7.0

+1.2 過小評価

パルプ・フィクション

実際

8.5

予測

7.4

+1.1 過小評価

ファイト・クラブ

実際

8.4

予測

7.4

+1.0 過小評価

ダークナイト

実際

8.5

予測

7.9

+0.6 過小評価

インターステラー

実際

8.5

予測

8.0

+0.5 的中

シンドラーのリスト

実際

8.6

予測

7.6

+1.0 過小評価

トランスフォーマー

実際

6.8

予測

6.9

-0.1 的中

📌 MSSは平凡な映画を正確に予測し、傑作を過小評価する──方程式に入らない「何か」が名作にはある

インターステラー（+0.5）とトランスフォーマー（-0.1）──MSSが最も正確に予測した2本は、対照的な映画だ。ノーラン監督のDISが高く上映時間も長いインターステラーは「構造的に良い映画」の典型。トランスフォーマーは「構造的に平凡な映画」の典型。どちらもモデルの想定通りだった。

一方、ゴッドファーザー（+1.4）とフォレスト・ガンプ（+1.5）はMSSを大きく超えた。コッポラのDISは高いが、ゴッドファーザーの★8.7はDISだけでは説明できない「何か」──脚本の完璧さ、マーロン・ブランドの存在感、1972年のアメリカが求めた物語──が加わっている。

逆に、MSSが実際より高く予測してしまう映画もある。キャッツ（2019年）は実際★4.1に対しMSS予測は★7.0。トム・フーパー監督のDIS、ジュディ・デンチやイアン・マッケランの脇役SIS──「構造」は完璧だった。しかし映画は壊滅した。構造では測れない「実行の質」が、ここでは致命的に欠けていた。

DATA 07 ── 予測不能な40%

MSSが予測できる60%と、できない40%。この境界線はどこにあるのか。MSSの「中身」と「外」を整理する。

MSSの「中身」と「外」

最適化後のウェイト（予算は除外済み）

📌 構造（監督・脇役・時間・ジャンル）で60%は予測できる。残り40%はデータの外にある「創造性」だ

脚本の質──MSSに含まれない最大の変数だ。MSSは「誰が撮ったか」は知っているが「何を書いたか」は知らない。『ゴッドファーザー』と『ゴッドファーザーPART III』は同じ監督だが、脚本の質が違う。データベースに「脚本の良さ」を数値化したフィールドはない。

俳優のケミストリー──個々の俳優のSISは測れても、「この2人が共演すると化学反応が起きる」は測れない。デ・ニーロとパチーノの共演は2人のSISの合計以上の何かを生む。これは構造変数では捉えられない創発的な現象だ。

時代との共鳴──『パラサイト』が2019年に世界を席巻したのは、格差社会への関心がピークに達していたからだ。同じ映画が2005年に公開されていたら、同じ反響があっただろうか。時代の空気は事後的にしか分析できない。

そして実行の質。同じ監督でも、体調、予算配分のミス、撮影中のトラブルで「いつもの水準」を下回ることがある。キャッツのトム・フーパー監督は、直前作『リリーのすべて』で★7.1を記録していた。構造は完璧でも実行が伴わなければ──それが40%の正体の一部だ。

映画の質を決める方程式は存在する。
最大の変数は「誰が撮るか」であり、
最小の変数は「いくらかけるか」だった。
そして方程式が予測できない40%こそが、
映画を「製品」ではなく「作品」にしている。

CONTEXT

3部作を振り返ろう。Vol.4のSIS分析は「名脇役は品質保証ラベルである」と結論づけた。Vol.5のDIS分析は「品質を設計しているのは監督である」と暴いた。そしてVol.6のMSSモデルは、この2つの「人的変数」が映画の質の75%を説明することを示した。映画とは、煎じ詰めれば「人」なのだ。

予算のウェイトがゼロだったことは、映画産業の構造を鋭く照射する。スタジオは「制作費$200M」を売り文句にするが、データはそれが品質と無関係であることを示す。金は視覚効果やマーケティングを買えるが、「いい映画」は買えない。いい映画は「いい人」──具体的にはDISの高い監督とSISの高い脇役──から生まれる。

ゴールドマンの「Nobody knows anything」に対するデータの回答は、こうだ。「We know 60%. And the other 40% is what makes it art.」 60%は構造で予測できる。監督の実績、脇役の質、上映時間、ジャンル──これらの「骨格」で映画の輪郭は描ける。だが傑作をデータから生み出すことはできない。ゴッドファーザーの脚本、デ・ニーロとパチーノのケミストリー、パラサイトと時代の共鳴──残り40%は、データの外にある人間の創造性だ。

この構造は映画だけの話ではない。ゲーム業界では宮本茂（マリオの生みの親）のディレクション力が任天堂の質を支配し、広告業界ではクリエイティブ・ディレクターが作品の質を決める。「創造的産業において、品質を決定するのは資本ではなくキーパーソンである」──MSSモデルが映画のデータから導いたこの法則は、あらゆるクリエイティブ産業に適用できる構造的真理だ。

🍿 今日のポップコーン

🎯雑学: キャッツ（2019）はMSS予測★7.0に対し実際★4.1。「構造的に完璧な映画が壊滅する」最も極端な例のひとつ。

📊データ発見: DIS+SISの2変数だけでr=0.667。5変数フルモデル（r=0.666）と同等。「人」だけで映画の質は予測できる。

🔍構造理解: ゴールドマンの「Nobody knows anything」はデータ的には不正確。正確には「We know 60%」。

NEXT QUESTION

MSSが予測できない「40%」の最大要因──
「原作あり」vs「オリジナル」で脚本力は測れるか？

映画分析シリーズ Vol.6 ── 金で名作は買えない。

データ出典: TMDB（The Movie Database）

📖 この記事を読んだ方におすすめの本

映画をデータで読むデータで見える映画産業の構造マネーボールマイケル・ルイスデータが常識を覆した実話

Amazon.co.jpアソシエイトリンクを含みます

SharePost on X

📖

Glossary

あの専門用語、どういう意味？
エンタメ例えでわかる用語集

→

←

映画のレシピ ②下手な役者でも名作は生まれる。下手な監督では生まれない。 ── DISが暴く「監督の支配力」の正体

→

「0から作る」より「1から作る」ほうが名作になる理由原作あり vs オリジナル、32,980本のデータが出した答え

Related Pop 🍿

文化

映画分析 Vol.6

金で名作は買えない。
5変数予測モデルが暴いた「いい映画」の設計図

監督・脇役・上映時間・予算・ジャンル──5つの変数で映画スコアを予測するモデルを作った。「映画のレシピ」3部作の完結編。

🎬 全ジャンル📊 TMDB📅 2026.2.21

監督、脇役、上映時間、予算、ジャンル──
5つの変数で映画の「当たり」はどこまで予測できるのか？

ANALYSIS TARGET

TMDBスコア（10点満点）× 5変数構造モデル

対象映画

6,650

使用変数

相関係数

r=0.666

指標

MSS（5変数合成スコア）

対象

投票50件以上 × 5変数完備

比較方法

線形回帰（z正規化後）

モデル

DIS 40% + SIS 25% + 他3変数

DATA 01 ── MSSモデルの設計図

MSS（Movie Structure Score）の構成

5変数のウェイト配分（初期設定）

MSS = DIS(40%) + SIS(25%) + Runtime(15%) + Budget(10%) + Genre(10%)

DIS

40%

SIS

25%

Runtime

15%

Budget

10%

Genre

10%

📌 監督（DIS）が全体の40%を占める。「映画のレシピ」の主成分は、カメラの後ろにいる人だ

z正規化により、スケールの異なる変数（上映分数と制作費$）を同じ尺度で比較可能にした。

DATA 02 ── 五分位テスト：MSSは機能するか

MSS五分位別・実際の平均スコア

6,650本をMSS順に5等分。各グループ1,330本

📌 MSS上位20%の映画は平均★7.17、下位20%は★5.69。スコア差1.48ポイント

MSSが高い映画ほど、実際のスコアも高い。モデルは「機能している」。

DATA 03 ── 的中率：60%の壁

MSSから線形回帰で予測スコアを算出し、実際のスコアとの誤差を計測した。的（まと）に見立てて、中心ほど「的中」だ。

MSS予測の的中精度

中心に近いほど予測が正確。6,650本の結果

📌 10本中6本は±0.5点以内で的中。90%は±1.0点以内に収まる

ただし10本中4本はズレる──そこに映画の「芸術性」がある。

DATA 04 ── 変数の格差

各変数の単独予測力

破線は5変数フルモデル（r=0.666）の参考ライン

📌 DIS単独（r=0.612）で5変数モデル（r=0.666）の92%の予測力を持つ

DIS+SISの2変数だけで r=0.667。5変数フルモデルとほぼ同じ。「人」だけで予測できる。

DATA 05 ── 予算の項はゼロだった

5つのウェイトを最適化したらどうなるか。DIS:40%、SIS:25%…の初期設定を、グリッドサーチ（全組み合わせ探索）で最適化する。

ウェイト最適化：初期設定 → グリッドサーチ結果

5変数のウェイトを5%刻みで全探索し、最も相関の高い組み合わせを特定

BEFORE（初期設定 r=0.666）

DIS

40%

SIS

25%

Runtime

15%

Budget

10%

Genre

10%

AFTER（最適化後 r=0.684）

DIS

45%

SIS

30%

Runtime

15%

Budget

Genre

10%

📌 予算の最適ウェイトはゼロ。75%が「人」（DIS+SIS）に集中した

金で名作は買えない──データが証明した。

DATA 06 ── 名作スコアカード

MSS予測 vs 実際のスコア

■ 的中（±0.5以内） ■ やや過小評価 ■ 大きく過小評価

ゴッドファーザー

実際

8.7

予測

7.2

+1.5 過小評価

フォレスト・ガンプ

実際

8.5

予測

7.0

+1.5 過小評価

ショーシャンクの空に

実際

8.7

予測

7.4

+1.3 過小評価

マトリックス

実際

8.2

予測

7.0

+1.2 過小評価

パルプ・フィクション

実際

8.5

予測

7.4

+1.1 過小評価

ファイト・クラブ

実際

8.4

予測

7.4

+1.0 過小評価

ダークナイト

実際

8.5

予測

7.9

+0.6 過小評価

インターステラー

実際

8.5

予測

8.0

+0.5 的中

シンドラーのリスト

実際

8.6

予測

7.6

+1.0 過小評価

トランスフォーマー

実際

6.8

予測

6.9

-0.1 的中

📌 MSSは平凡な映画を正確に予測し、傑作を過小評価する──方程式に入らない「何か」が名作にはある

DATA 07 ── 予測不能な40%

MSSが予測できる60%と、できない40%。この境界線はどこにあるのか。MSSの「中身」と「外」を整理する。

MSSの「中身」と「外」

最適化後のウェイト（予算は除外済み）

📌 構造（監督・脇役・時間・ジャンル）で60%は予測できる。残り40%はデータの外にある「創造性」だ

CONTEXT

🍿 今日のポップコーン

🎯雑学: キャッツ（2019）はMSS予測★7.0に対し実際★4.1。「構造的に完璧な映画が壊滅する」最も極端な例のひとつ。

📊データ発見: DIS+SISの2変数だけでr=0.667。5変数フルモデル（r=0.666）と同等。「人」だけで映画の質は予測できる。

🔍構造理解: ゴールドマンの「Nobody knows anything」はデータ的には不正確。正確には「We know 60%」。

NEXT QUESTION

MSSが予測できない「40%」の最大要因──
「原作あり」vs「オリジナル」で脚本力は測れるか？

映画分析シリーズ Vol.6 ── 金で名作は買えない。

データ出典: TMDB（The Movie Database）

📖 この記事を読んだ方におすすめの本

映画をデータで読むデータで見える映画産業の構造マネーボールマイケル・ルイスデータが常識を覆した実話

Amazon.co.jpアソシエイトリンクを含みます

SharePost on X

📖

Glossary

あの専門用語、どういう意味？
エンタメ例えでわかる用語集

→

←

映画のレシピ ②下手な役者でも名作は生まれる。下手な監督では生まれない。 ── DISが暴く「監督の支配力」の正体

→

「0から作る」より「1から作る」ほうが名作になる理由原作あり vs オリジナル、32,980本のデータが出した答え

Related Pop 🍿

文化

エンドゲームの後、MCUに何が起きたか -- 37作品スコア推移で見るフランチャイズ疲労の構造

2026.3.13

文化

ベクデルテスト合格率44%──　映画の半分は、女性同士が会話しない

2026.3.1

文化

リメイクの76%はオリジナルを超えられない。でもハリウッドがやめない理由がある。

2026.2.27

← Back to Home

金で名作は買えない。5変数予測モデルが暴いた「いい映画」の設計図

Glossary

Related Pop 🍿

エンドゲームの後、MCUに何が起きたか -- 37作品スコア推移で見るフランチャイズ疲労の構造

ベクデルテスト合格率44%── 映画の半分は、女性同士が会話しない

リメイクの76%はオリジナルを超えられない。 でもハリウッドがやめない理由がある。

金で名作は買えない。5変数予測モデルが暴いた「いい映画」の設計図

Glossary

Related Pop 🍿

エンドゲームの後、MCUに何が起きたか -- 37作品スコア推移で見るフランチャイズ疲労の構造

ベクデルテスト合格率44%── 映画の半分は、女性同士が会話しない

リメイクの76%はオリジナルを超えられない。 でもハリウッドがやめない理由がある。

金で名作は買えない。
5変数予測モデルが暴いた「いい映画」の設計図

ベクデルテスト合格率44%──　映画の半分は、女性同士が会話しない

リメイクの76%はオリジナルを超えられない。でもハリウッドがやめない理由がある。

金で名作は買えない。
5変数予測モデルが暴いた「いい映画」の設計図

ベクデルテスト合格率44%──　映画の半分は、女性同士が会話しない

リメイクの76%はオリジナルを超えられない。でもハリウッドがやめない理由がある。