■走行距離の少ない選手=ダメな選手なのか?
スポーツ中継を見るとき、私たちは知らないうちに様々なデータを目にしている。たとえば野球では、打者がバッターボックスに立つと、ピッチャーやキャッチャーはその打者の癖、好みなどのデータから戦略を立てている。守備の選手も、その選手の打球の傾向に応じて守備陣形を調整する。
視聴者も、その打者の直近の結果や通算成績などを見て、「このバッター、ホームランが期待できるんじゃないか?」などと期待する。1980年代からは、ランナーが得点圏にいる時の打率を抽出した「得点圏打率」と呼ばれるデータが活用されており、当然、高い値が出ていれば、チャンスが得点に繋がる可能性が高い。プレーヤーはたくさんのデータを活用しているし、見る側もたくさんのデータを目にして、楽しんでいる。
ところが様々なデータのなかで、データだけが独り歩きしてしまっているものがある。その例として挙げられるのがサッカーの中継でよく取り上げられる「走行距離」だ。その上位10チームを見てみよう。
このデータを見る限り、よく走るチーム=順位が高いとはいえない。チームの強さと走行距離の相関性はあまり高くないと言える。
ところが、「あのチームは走らないからダメなんだ」という意見はよく聞かれる。このような意見が出てくる原因は、「こうしたデータが提供されているから」ではないだろうか。データが提供されることで、私たちは自然と解釈してしまう。数字として具体化されているデータには、そうしたチカラがあり、私たちはついつい与えられたものに引きずられてしまうのだ。
■現場で使われるデータとはなにか
大別すると、スポーツに関わるデータには2種類あると考えられる。「現場で使われるデータ」と、「観戦して楽しむためのデータ」だ。この2種類を混同してしまうと前述のような悲劇が起きる。
前者の「現場で使われるデータ」=勝つためのデータについて考えてみよう。
「チームの平均走行距離には、勝利(順位)との強い相関性はない」と書いた。では、勝利との相関性のないデータを、なぜ計測しているのか。 すべてのチームが同じ理由とは限らないが、私は「コンディションのチェック」であると考える。
サッカー、バスケットボール、アメリカンフットボール、アイスホッケーなど各種スポーツチームが導入しているのが、この豪CATAPULT社のOptimEye だ。iPhoneなどでも使われているGPS情報と、地磁気センサーによって高精度の運動情報を取得することができる。
前述のスポーツの共通点は、チームスポーツであること。チームスポーツでは、各選手の動きの連動、すなわち戦術の遂行が重要になる。そこに綻びをもたらすのが「疲れ」だ。こういった疲れを可視化できるのがOptimEyeのようなデバイスである。
また、疲れた状態で無理に戦術を遂行しようとすると、身体の限界を超えてケガをしてしまう可能性が高まる。ケガにつながるような疲れ、コンディション不良を事前に察知して、手を打つことができることには大きな意味がある。走行距離は、こうした選手のコンディションを知るために取得しているデータを、「なんの加工も解釈もせず、生のまま」出してしまったものではないだろうか。
勝つためのデータは、GPSデバイスのデータだけではない。野球には、セイバー・メトリクス(SABR metrics)というものがある。これは、選手の成績、試合の結果、球場のスペック、対戦相手など、野球に関わる多角的なデータを統計学的に分析して、選手の能力、チームの強さを知り、チームの経営や戦略に役立てる手法や考え方だ。
セイバー・メトリクスが特徴的なのは、データを判断する基準として統計学を導入したことにある。「勝つためにより重要な」データを求めて、既存の枠組みを越えて新しい評価指標を求めた。これまでのデータの評価、解釈の仕方を改め、生のデータを加工や解釈をして、新たなデータに再編していった。ここで導入された指標は、たとえば「選手の得点能力を指標化」、「投手の投球・プレーから運の要素を除外して評価」など、選手の成績・パフォーマンスの統計を現代風にアレンジしたものだ。
選手の得点能力はOPSと呼ばれ、現在MLB(メジャーリーグ)の公式記録の1つにもなっている。従来の打率・本塁打数・打点だけでは測れなかった打者の能力を評価するために、出塁率と長打率を組み合わせた値になっている。そのためMLBではシングルヒットがある程度多い選手でも、それほど評価を高めることができないことがある。
GPSデバイスやセンサーのデータは決して一般公開されることはないが、テレビでよく見る球速、コースや球種だけでなく、打球の角度やカーブ、着地点なども統計されている。打者にとっては苦手なコース、球種などが残酷なまでにはっきりと統計される。これらの新たな指標によって勝つためのデータは大いに進歩している。
この動きに呼応して、NBAではバスケ版セイバー・メトリクス(APBRmetrics)が生まれてきている。しかし現状ではPER(Plyaer Efficiency Rating:プレー時間を考慮した上で得点だけでなくアシストや3ポイントなども含めたプレーの有効性を測る指標)、WS48 (Win Shares Per 48 Minutes:1試合フルタイム換算での期待勝利値)などのAPBRmetricsの指標はあくまでも補助的なものという位置づけだ。MLBほどこれらの指標は重要視されていない。
その理由は戦術にある。野球は局面が区切られており、データが影響する範囲がかなり狭い。守備時にボールが飛んでくる方向は、ほとんどの場合打者からか、他の守備者からに限られる。だから前述のUZRみたいな評価指標が簡単に導き出せる。
バスケを代表とするチームスポーツでは、戦術を遂行するための能力が必要で、それに適した汎用的な指標は現状では汎用的に使えるものがない。
たとえばサッカーでは時間ベースの指標を用いることは難しい。元サッカーアテネオリンピック男子代表監督だった山本昌邦氏は「流れの中の約75%のゴールは、相手ボールを奪ってから15秒以内のものです(http://www.masakuni-yamamoto.com/2003/05/01/157/ より引用)」と、速攻を重視していた。山本監督にとってはボールを奪ってから決定機に至るまでの時間統計は有用だったかもしれないが、ボールをゆったりと回しながら、相手の隙を伺うスタイルのサッカーを指向する監督では意味がないかもしれない。
前述の例の通り、統計情報は戦術とリンクさせて解釈をすることが難しい。だから、単なる統計ではない、違った角度から得られるデータをより適切に解釈ができる指標が必要になってきている。サッカーやアイスホッケーでも事情は似たようなものになってきている。チームスポーツのために勝つためのデータは、もう少し改良が必要だ。
■スポーツ観戦を楽しむためのデータとは
次に、観戦者にとって役立つデータとは何かを考えよう。多くのスポーツは、得点によって勝敗を決する。「得点が入ったら喜ぶ」のはシンプルな楽しみ方だ。適切なデータが提供されれば、観戦者はより楽しむことができる。たとえばプロ野球では多くのスタジアムで投手の球速が表示される。ある投手の投げたボールが、前の投手のものよりも大きければ、「あの投手はとても速いボールを投げている、すごいぞ」と、より興味を深めてくれる。
また選手の成績・パフォーマンスの統計データは、普段からその選手を注視していない者に、様々な予測と期待をもたせてくれる。どういうプレーが得意なのかがわかれば、それを期待する。たとえばバスケットボールで選手が交代したときに、3P%(スリーポイント成功率)という指標が示される。その数値が高ければ、「あ、この選手はスリーポイントシュートが得意なんだな」と理解し、距離のある位置からのシュートを期待する。このようにその時々に応じて適切な加工が行われたデータが、適切なタイミングで提供されることが望ましい。
では、観戦や視聴を誘うためのデータにはどんなものがあるだろうか。統計学で取り扱うデータは質的データと量的データに分類できる。質的データは基本的に計算に用いることができないデータを指す。チームスポーツの背番号のような名義データや順位表の順序のような順序データも質的データに分類される。2017年8月に行われたサッカーワールドカップアジア予選の日本対オーストラリア戦を例に、どんなデータが役に立つのかを考えてみる。以下のような質的データが観戦や視聴を誘ってくれるだろう。
1.日本代表の予選突破条件
2.日本代表に選ばれている選手にはどのような選手がいるのか
3.日本代表に選ばれている選手の記録やエピソード
4.選手の写真のような見た目のデータ
5.日本代表の予選順位
量的データは逆に計算ができるデータだ。スポーツの統計情報などはほとんど量的データと考えることができる。たとえば以下のような量的データが観戦者の興味を引いてくれるだろう。
1.日本代表チームの総勝ち点
2.日本代表チームの得失点差
3.W杯アジア予選の初戦で敗れたチームは過去一度も予選を突破していない=W杯アジア予選の初戦で敗れたチームの予選突破確率0%
4.大迫勇也選手の先発時の勝率
5.日本代表チームの各選手の直近のゲームでの成績
何よりも、このゲームでW杯の出場が決まるかもしれない、という質的データが優先して強調されるべきだ。さらにどんな選手が出場するのかという質的データと、その選手の量的データ、またチームとしての成績や過去の予選の統計データなどの量的データが、私たち観戦者の興味を深めてくれるだろう。初戦に敗れたチームの予選突破確率0%のような不吉なデータは不安感を煽り、「応援しなければならないのでは?」という気持ちにさせられる。
試合開始直前には、出場選手が決定する。このタイミングで、予想フォーメーション(質的データ)や過去ゲームの各種統計データ(量的データ)を用いて、今日のゲームはどのような組み合わせが試されるのか、過去どのようなコンビネーションから勝利を得られたのかなどを分析し、ゲームの展望や結果のシミュレーション解析などで興味を引くこともできるだろう。
■改良が求められるリアルタイムのデータ提供
そしてゲーム中は、どちらのチームが優勢なのかなど、ゲームの内容を理解するためにゲーム途中の統計データ、ゲームがどのような展開を示すかなどの予測データを用いられるのが適切だろう。
上記データを語る上で無視できないのが、いわゆる「データプロバイダー」だ。スポーツ関連で世界最大手のデータプロバイダーが、DAZNも属しているパフォームグループの「Opta Sports」である。Optaのデータフィードはかなり詳細で、どの選手間のパスによってゲームが組み立てられているのかなどのデータが提供される。契約をしていないと受け取れないが、各種スカウトシステムや放送局、またFIFAやAFCの公式サイトでも、そのデータは目にできる。サッカーW杯アジア最終予選の日本対オーストラリアの試合のOptaデータもAFCのWebサイトで確認でき、以下のデータが取得できる。
1.ヒートマップ(ゲームのフィールド上での選手の活動位置を表すマップ)
2.平均ポジション
3.アタッキングサード(攻撃時の左右中央のバランスをパーセンテージで表したもの)
4.アクションエリア(フィールドをゴールから相手のゴールまでを3分割した場合のポゼッション率の割合)
5.ゴールリプレイ(決定機をゴール、失敗のすべての流れを記録して確認できるもの)
6.チョークボード(選手を選択して、各種プレーがどのように行われたかを確認できる)
7.パスコンビネーション(もっともパス交換の多かったベスト5と、特定の選手同士のパス交換を確認できる)
8.特定の選手同士のスタッツ比較
こうしたデータをかみ砕くと、より興味を引けるかもしれない。パスコンビネーションを見ると、パスが繋がった組み合わせのうち、吉田麻也から酒井宏樹へのパスが最多で10、長谷部誠から酒井宏へのパスが2位で8、4位に酒井宏から浅野拓磨へのパスが6となっている。
さらにチョークボードで成功したパスと失敗したパスを並べてみる。
濃い色の矢印が成功したパス、赤い色の矢印が失敗したパスを示している。圧倒的に成功したパスが多く、酒井宏の貢献度をうかがわせる。彼はパスを受け取ることができるようにオーストラリア選手を剥がし、かつ精度の高いプレーで浅野を活かしたとも言える。残念ながら現時点では、酒井宏がこれだけゲームの組み立てに関わっていることをデータとしてリアルタイムでは与えられない。そのため、どうしてもゴールした選手に注目が集まるが、サッカーのような戦術への依存度が非常に高いチームスポーツでは、ゴール以外のところの選手の働きにも注目するべきなのだ。
酒井宏の貢献が適切にわかると、「酒井宏樹は日本代表のチームの組み立てを支えている」と理解できる。そうやって興味を持ったら、「酒井宏樹は柏レイソル出身で、現在はフランスの名門チームに所属しているのか」という質的データへの欲求が高まるかもしれない。この相互作用こそが、スポーツ観戦により深みを与えてくれる。現在、ライブで提供されるデータは「スタッツ」と呼ばれるシュート数、パス数、イエローカード、レッドカードなどの一覧だけの場合が多いが、そこから何を読み取ればいいのかはわかりにくく、大いに改善の余地がある。
ポジティブな傾向として、各種スポーツでスマートスタジアム構想というITを活用した観戦環境の変革が進められている。これまでテレビ放送でのみ取得できた様々なデータが、現地での観戦でも取得できるようになることを意味する。すると、現地での観戦者も豊富なデータに触れることができるようになる。これはチャンスではないだろうか?
もっといろいろなデータを取得できるようになり、それを適切に解釈して活用できる人材が揃えば、スポーツ観戦は今よりももっと面白くなる。面白いデータを提供することで、今まで以上に観戦者が楽しめる。そんな新しい観戦環境はすぐ近くまできているはずだ。
(了)
本記事を執筆する際には以下の書籍を参考にさせていただいている。この記事でデータに興味を持ったら、是非購入して勉強をしてみて欲しい。
■現場ですぐ使える時系列データ分析~データサイエンティストのための基礎知識~/横内大輔、青木義充
■[プロ野球でわかる!]はじめての統計学/佐藤文彦
■調査統計データのリテラシー超入門/衣袋宏美
日本はいつまで「質より量」の練習を続けるのか? 坪井健太郎インタビュー
「長時間の練習、絶え間ない努力が結果に結びつく」。日本では長らく、スポーツのトレーニングに質より量を求める風潮があり、その傾向は現在も続いています。結果として、猛暑の中での練習による事故、罰走を課せられた選手が重体になる事件など、痛ましいニュースが後を絶ちません。 海外に目を移せば、十分な休養、最適な負荷がトレーニングに必要な要素という認識がスポーツ界でもスタンダードになっています。サッカー大国・スペインで育成年代のコーチを務める坪井健太郎氏にお話を伺いました。(取材・文:大塚一樹)
海外から見る、日本のスポーツメディアへの違和感。特別寄稿:岡部恭英
先日、ある選手がミックスゾーンで喋ったコメントが恣意的な抜き出し方をされ、多くの批判にさらされるという事案がありました。これに限らず、現場の大小問わず「スポーツメディアは信用できない」という意見を頂戴することは一度や二度ではありません。弊媒体含め、発展すべき余地が大きいのが日本のスポーツメディアの実情だと思います。今回は「日本のスポーツメディアは外側からどう見えるのか」をテーマに、UEFAチャンピオンズリーグに携わる岡部恭英氏に寄稿を依頼しました。(文:岡部恭英)
レスター・シティは、データとどのように向き合っているのか? ポール・バルソム氏インタビュー
2015-16シーズン、クラブ創設132年目にして初となるリーグ優勝を果たしたレスター・シティ。強さの一端を担ったのが、スポーツサイエンスだ。Catapult社のトラッキングテクノロジーを用い、選手の負荷を徹底管理。岡崎慎司ら、運動量の多い選手は最後まで大きな負傷をせずに乗り切った。実際にどのような運用がなされていたのか、Head of Sports Science and Performance Analysisを務めるポール・バルソム氏に話を伺った。※本記事は、Catapult社の提供でお送りします。【PR】
総額80兆円! 中国のスポーツ投資に、日本はどう対抗すべきか。特別寄稿:岡部恭英日本代表に足りない“ポジショナルプレー”とは何か? 五百蔵容×結城康平対談(1)「地面に着いてから蹴る、では遅い」。走りのプロ・杉本龍勇が語る“桐生の9秒台"。