xGを裏切り続けた120分、
データが語るW杯2022名勝負
StatsBomb xGデータで読む、史上最高の決勝戦と名勝負の構造
2022年12月18日、ルサイル・スタジアム。アルゼンチンがフランスに2-0でリードしたまま80分を迎えたとき、この試合は「メッシの戴冠」で終わる予定だった。
ところが80分、ムバッペが97秒間で2ゴール。試合は2-2に。延長でメッシが押し込めば、ムバッペがPKでハットトリック。3-3でPK戦へもつれ込んだ。
xG(期待ゴール)とは、あるシュートがゴールになる確率のことだ。ペナルティエリア内の正面なら0.3前後、エリア外のミドルシュートなら0.03程度。つまり「10本打てば3本入る」位置と「30本に1本しか入らない」位置を数値化したもの。試合中の全シュートのxGを足せば「確率的に何点入るべきだったか」がわかる。この記事ではPKを除いたnpxG(Non-Penalty xG)を主に使う。PKは位置が固定で成功率約78%と「確率の揺らぎ」がほぼないため、番狂わせの分析から除外するためだ。
この記事では、StatsBombの全64試合イベントデータを使い、W杯2022の名勝負を「xGの裏切り度」で解剖する。データが教えてくれるのは「何が起きたか」だけでなく、「何が起きるはずだったか」だ。
そして、xGを裏切ったチームが勝ち上がったのか?
全64試合のnpxG合計と実ゴール数を散布図にプロットした。対角線がxGどおりのライン。その上に位置する試合ほど「xGを超えて得点が生まれた」ことを意味する。
決勝(ARG 3-3 FRA)は合計npxG 2.7に対して実ゴール6。ほぼ2倍だ。両チームが相手GKの想定を超え続けた結果、このとんでもないスコアが生まれた。
逆に、グループステージのクロアチア対ベルギー(0-0)はnpxG 3.1にもかかわらずスコアレス。xGの「確率」がいかに試合結果と乖離しうるかを示している。ベルギーの「黄金世代」はこの無得点で大会を去った。
決勝の120分間を、アルゼンチンとフランスの累積npxGとして可視化した。線の傾きが急なほど短時間にチャンスが集中していたことを意味する。
このグラフが物語るのは「2つの試合」だ。79分まではアルゼンチンの完勝。npxGは0.77対0.15で、フランスはほぼシュートチャンスすら作れていなかった。
だがムバッペの2ゴール(80分のボレーはnpxG 0.10、つまり10回に1回しか決まらないシュート)で試合は一変する。フランスのnpxG曲線が80分から急上昇しているのは、2点取ったことでアルゼンチンが動揺し、試合がオープンになった証拠だ。
延長107分、メッシがゴール前の混戦から押し込んだシュートのxGは0.49。決定的とまではいえない位置からだったが、最後は36歳の左足が大会を決めた。つまり、この決勝の3つの非PKゴールはすべて「確率的には外れてもおかしくなかった」シュートから生まれたのだ。
W杯2022でxG差が最も大きかった番狂わせ試合をランキングした。上段が有利チームのxG、下段が番狂わせ側のxG。差が大きいほど「奇跡」だ。
最大のxG番狂わせはカメルーン対ブラジルだった。ブラジルのnpxGは2.38に対しカメルーンは0.38。xG差6倍の試合でカメルーンが1-0で勝利した。グループステージ突破済みのブラジルがメンバーを落としていたとはいえ、データ上は圧倒的不利な戦いだった。
アルゼンチン対サウジアラビアはxG差11倍の衝撃。アルゼンチンのnpxGは1.71、サウジアラビアは0.15。2ゴールのxG合計0.11。あの2本が両方入る確率は約1%だ。アル・シェフリの低いシュートがGKの手をすり抜け、アル・ダウサリのカーブがポスト内側に吸い込まれた。
日本のドイツ戦も興味深い。ドイツのnpxGは1.98で日本の1.25を大きく上回るが、後半のパワープレーが実った。堂安のシュート(xG 0.48)と浅野のシュート(xG 0.03)。特に浅野の30本に1本しか入らない角度からのゴールが、xGの限界と「人間」の可能性を象徴している。
各チームが「xGに対してどれだけ得点できたか(または得点できなかったか)」を示す。右に伸びるほどxGを超えて決めまくったLuckyなチームだ。
オランダ(+5.0)が最もLuckyだった。npxG 5.0に対して10得点。2倍の得点効率を見せた。しかしこれは「運が良かった」というより、フィニッシュの精度が高かったとも読める。xGモデルはシュート位置と状況から確率を算出するが、シューターの個人能力は加味しない。
一方、ブラジル(-2.7)とベルギー(-2.7)は最もUnlucky。ブラジルはnpxG 9.7と大会屈指のチャンスを作りながら7得点にとどまった。クロアチア戦(準々決勝)では120分間でnpxG 1.82を積み上げながら延長後半のネイマールのゴール(xG 0.47)しか決められなかった。
優勝したアルゼンチンは+1.0。ほぼxGどおりに得点しており、「幸運で優勝した」のではなく、チャンスをチャンスどおりに決めた正当な王者だったことがわかる。
大会が進むにつれて「xGからの乖離」は大きくなるのか。ステージごとの平均ゴール数とnpxGを比較した。
グループステージでは1試合平均2.3ゴールに対してnpxG 2.1。ほぼxGどおりの結果が出ている。しかし大会が進むにつれて「xGからの乖離」が大きくなる傾向がある。
ラウンド16では非PK平均3.1ゴール対npxG 2.3。敗退すれば終わりのノックアウトステージでは、選手の集中力が「確率以上」のシュート精度を生む可能性がある。
そしてその究極形が決勝だ。npxG 2.7に対して6ゴール。「確率の2倍以上の得点が生まれた」試合が大会の最後に来たことは、W杯2022が最後まで観客を裏切り続けた証拠でもある。
サンプルが減ると、確率は裏切る
W杯2022は、xGモデルの限界を最も鮮やかに示した大会だった。64試合中17試合(27%)でxG優勢チームが敗北している。これはリーグ戦(通常15-20%程度)と比べて明らかに高い。
その原因は「一発勝負」の構造にある。リーグ戦は38試合かけて運を平滑化するが、W杯は3試合のグループステージ+負ければ終わりのノックアウト。サンプルが小さいから分散が大きくなる。加えて、選手にかかるプレッシャーの非対称性がxGモデルに織り込まれていない変数として働く。
しかし「xGが使えない」という結論は正しくない。大会全体で見れば、総ゴール172に対して総xG(PK・シュートアウト除く)は156。マクロではゴール数がxGをやや上回る程度に収まっている。xGが「裏切られる」のは個別の試合レベルであり、それこそがサッカーの魅力だ。
この分析にはいくつかの限界がある。xGモデルはシュート時の状況(位置、角度、プレッシャー)を加味するが、シューター個人の能力やGKの質は反映しない。ムバッペのフィニッシュ精度はxGモデルが想定する「平均的なシューター」を大きく上回る。また、PK戦のxGは一律0.784(成功率約78%)で計算されるため、分析からは除外した。
W杯2022がデータに教えてくれたのは、確率とは「最も起こりやすい結果」を示すだけで、「起こる結果」を決めるものではないということだ。そしてサッカーという競技は、その確率の隙間に最も美しいドラマを詰め込む。
最もパスが多いリーグと、最もプレスが激しいリーグは同じか?
サッカー分析シリーズ Vol.3 ── W杯2022名勝負xG
データ出典: StatsBomb Open Data (github.com/statsbomb/open-data)
xGはStatsBomb独自の期待ゴールモデルによる算出値。npxGはPKシュートおよびPK戦を除いた期待ゴール値
📖 この記事を読んだ方におすすめの本
Amazon.co.jpアソシエイトリンクを含みます



