Идея для данного материала возникла при прочтении книги Даниэля Канемана «Думай медленно… Решай быстро» (Thinking: fast and slow). А именно – при рассмотрении темы «Цели – отправные ориентиры».
Там есть ссылка на исследование экономистов из Пенсильванского университета Девина Поупа и Морина Швейцера: они проанализировали более 2,5 миллиона паттов – это удары гольфистов, после которых мяч попадает непосредственно в лунку – и выяснили, что спортсмены качественнее выполняют последние удары «пар-игры» (пар – количество ударов, за которое игрок должен пройти лунку по регламенту), чтобы избежать «боги» (один лишний), нежели «бёрди» (на один удар меньше лимита).
Исследование и его результаты ложатся в канву разработанной Канеманом и Амосом Тверски «Теории перспектив»: некоторые удары при их одинаковой объективной ценности субъективно будут восприниматься по-разному. Всё решает установленная заранее отправная точка, которую в данном случае можно сформулировать как «непоражение». Промах при «бёрди» – лишь упущенная выгода, ситуация не отменяет того, что все остаются при своем. Промах при риске сделать на один удар больше нужного – поражение, утрата равновесия, которое было до удара.
Более значительная мобилизация усилий при потенциально проигрышной ситуации, чем при потенциально выигрышной – яркий пример поведенческой аномалии, которая называется «неприятие потерь» (описана в рамках «Теории перспектив»), которую можно проиллюстрировать «денежным» примером: внезапно потерявший 100 долларов человек утратит большее количество единиц полезности, чем получит неожиданно нашедшая данную сумму персона.
В качестве объяснения данной асимметрии была предложена основанная на эволюционных механизмах гипотеза: если организм реагирует на угрозу сильнее, чем на приятную перспективу, шансы на его дальнейшее выживание выше.
Футбол, как мы понимаем, не лишен ситуаций, аналогичных с возможностью превысить лимит или, напротив, недобрать количество ударов в партии. Мы решили проверить, как футболисты реализуют явные моменты при разном счете, ходе матча:
- когда команда проигрывает (шанс вернуться к предполагаемой точке отсчета);
- играет вничью (шанс уйти от точки отсчета в сторону приятной перспективы);
- уже ведет (улучшение выгодного положения).
Что считать явным голевым моментом?
Процесс ответа на заданный выше вопрос получился даже, пожалуй, более интересным, чем поиск ответа на изначальный. Начнем с того, что людям при просмотре свойственно бинарно разделять удары по воротам на «опасные» и «не несущие значимой угрозы»: промахи при виде одних моментов мы воспринимаем достаточно бурно, в то время как неточные удары в иных ситуациях – буднично. Сделаем допущение, что в описанном выше примере «зритель» мыслит теми же стандартами, что и та модель ожидаемых голов, которая оценивает опасность ситуации не по результату удара, а по его условиям (хотя с сожалением приходится констатировать, что многие всё же мыслят в духе подаваемой, например, Ла Лигой статистики, смешивая опасность и от условий, и от результата удара).
К счастью, для выяснения усредненной опасности того, что зритель посчитает явным голевым моментом, нам не пришлось проводить опрос и обучать большое количество людей мыслить, как xG-модель. Забавно об этом думать, но для конкретной работы большую пользу имеют введенные уже более 10 лет назад компанией Opta «биг-шансы». Согласно их определению, «биг-шанс» – это ситуация, в которой разумно ожидать, что наносящий по воротам удар игрок реализует момент. Как правило, это ситуации при выходе один на один, при ударах с близкого расстояния, а также когда у мяча есть очевидный путь в сторону ворот или на бьющего не оказывается значительного давления. Пенальти всегда считаются явными голевыми моментами.
Из определения понятно, что инструмент довольно древний; в каких-то случаях просто бесполезен (аналитиками в клубах, разумеется, всерьез не воспринимается), в каких-то – вредный (некоторыми медиа все еще котируется, что печально). Однако в случае с конкретно нашим исследованием данные по «биг-шансам» будут чем-то вроде опроса операторов Opta, в рамках которого мы задаем им вопрос: «Насколько опасным должен быть удар, чтобы относительно подготовленный человеческий глаз посчитал его за явный момент?»
Без учета пенальти на дистанции 7892 «биг-шансов» их реализация составляет лишь 39,8%. Выходит, что вероятность успеха в ситуации, которую оператор Opta считает голевым моментом, ниже, чем удачный исход при подбросе монетки
Кроме того, аналогичным инструментом обладает и Wyscout: их операторы могут поставить удару флажок opportunity, если считают конкретный момент достаточно хорошей возможностью забить мяч в ворота. Эта метрика менее известна, чем «биг-шансы» от Opta, что объяснимо куда меньшим присутствием данных от Wyscout в спортивных медиа. Здесь ситуация еще хуже, чем у Opta – реализация составляет лишь 13,7%.
На самом деле, довольно фундаментальный момент в плане того, как стоит реагировать на исход «хороших моментов»: в конкретной ситуации (или группе ситуаций) гол – не что-то само собой разумеющееся, а промах – не повод разочаровываться и упрекать бьющего. Условно, нападающий может реализовать только один «явный» момент из трех, но далеко не факт, что их суммарная острота превысит 1 xG. Вряд ли уместно на данном гипотетическом отрезке говорить об андерперфомансе – реализовав один из трех ударов по 0,3 xG, футболист будет иметь позитивную разницу фактически забитых и ожидаемых мячей.
В качестве эксперимента мы провели опрос в Telegram-канале «Матэ в бомбилье», где было размещено видео с тремя «голевыми» моментами с участием Дарвина Нуньеса: уругваец реализовал только один из них, однако суммарная опасность его ударов составила чуть ниже 1 xG, согласно оценкам модели от Statsbomb (и ощутимо ниже – у Wyscout и Understat).
На этой скромной дистанции Нуньес продемонстрировал оверперфоманс относительно xG. Однако 48% опрошенных посчитали, что Дарвин мог забивать больше одного мяча; представив на его месте игрока своей любимой команды, они были бы разочарованы такой реализацией. Стоит сделать оговорку, что аудиторию, которая давала ответ на этот вопрос, можно назвать более подготовленной, чем среднестатистического любителя футбола – возможно, кто-то проигнорировал просьбу «не мыслить, как xG-модель» и недостаточно доверился своему автоматическому мышлению при ответе на этот вопрос.
При этом 48% посчитавших, что забито недостаточно, – всё равно очень значительный результат даже при таких поправках. Соответственно, можно выдвинуть гипотезу, что человеку в принципе свойственно переоценивать некоторые категории ударов – люди и ощущают («должен быть гол»), и запоминают («должно быть много голов») такие моменты бинарно.
Возникает логичный вопрос: почему люди – даже относительно подготовленные – оценивают «явные моменты» таким образом? Чтобы приблизиться к ответу, стоит переформулировать вопрос и задать его иным образом: почему люди выделяют в качестве опасных моментов не только ситуации, где ждать гола действительно разумно (на наш взгляд, стоило бы брать отметку в 0,5 xG и более), но и удары весьма сомнительного качества?
Здесь есть смысл снова обратиться к когнитивным искажениям и понятию «отправная точка», но уже в более контекстном значении. Согласно xG-модели от Wyscout, 62,3% от общего количества ударов в нашей выборке (128 тысяч, пенальти исключены) имеют вес менее 0,1 xG, 93,4% – менее 0,35 xG.
Ориентир в 0,35 xG был взят неслучайно – в свое время аналитик Марк Тэйлор в материалах на ресурсе Infogol давал такую планку для «голевых моментов», что близко к полученным нами цифрам.
Безусловно, стоит оговориться, что модель от Wyscout относится к категории «наивных», то есть не учитывает фактор давления на игрока в момент удара, возможных помех на пути мяча в поле, а также положение голкипера. Тем не менее нет уверенности, что она: а) на дистанции уступает человеческим субъективным оценкам в «правдивости»; б) имеет принципиально иное распределение по сравнению с более продвинутыми моделями. Ей по-прежнему пользуется большое количество клубов по всему миру, считая достаточно качественной для возлагаемых задач (не означает «лучшей»).
Возвращаясь к полученным данным: удары с вероятностью забить выше 10% мы справедливо воспринимаем как довольно редкое явление, с вероятностью 35% и выше – как очень редкое. Можно предположить, что в момент оценки происходит подмена вопроса: вместо «Хороший ли это момент?» человек спрашивает у себя «Достаточно ли «доступно» создание удара такой остроты?», и после получения утвердительного ответа мы классифицируем момент как «хороший». То есть, при просмотре футбола люди не без причин привыкают к тому, что большинство моментов – низкокачественные, а всё, что в какой-либо степени от них отличается, воспринимается по-особенному. «Средний» удар низкого качества – отправная точка, с которой мы сравниваем все шансы в матче.
Отметим также эволюционный фактор, который касается футбола, – с каждым годом средняя дистанция до ворот при ударе снижается, их усредненный вес повышается. Соответственно, лет 15 назад, когда футбол в целом сильно хуже нашего времени понимал, что такое матожидание, облик «обычного удара» был еще более печальным. Для определенной доли людей может быть актуальна привязка не к «плохому удару» из настоящего времени, а к тому, чем он был какое-то количество лет назад.
Вследствие всего вышеуказанного было решено каждый из возможных ходов матча проверять тремя категориями ударов без учета пенальти:
- все удары;
- удары с вероятностью забить 35% и выше;
- удары с вероятностью гола 50% и выше.
Влияние счета, хода матча на реализацию.
В общей сложности мы обработали 128 305 ударов, которые были взяты исключительно из матчей национальных чемпионатов. Матчи турниров на выбывание не рассматривались для исключения ситуаций, при которых ничья или победа означают, что команде всё еще надо отыгрываться.
Кроме того, ход условной встречи рассматривался нами и более узким способом: крупные категории «команда ведет в счете» и «команда проигрывает» были дополнительно разделены на более мелкие – в один мяч, в два, в три и более.
Проверка производилась при помощи метрик «G/xG» (отношение количества фактически забитых голов к ожидаемым, согласно созданным до момента удара условиям) и «xG2/xG». Метрика xG2 – схожая с xG, она оценивает не только условия, но и результат удара (координаты прилета мяча). Также может быть известна как xGOT, PSxG – аналоги от других провайдеров.
Рис. 1. График с обобщенным game state
Первое, что бросается в глаза, – принцип из гольфа, представленный выше, здесь не работает. Если учесть все удары, при преимуществе в счете команды получают в среднем более качественные удары (xG/Sh составляет 0,13 против 0,11 при ничьей и поражении), лучше конвертируют опасность условий и в целом преобразуют пост-шот и пре-шот непосредственно в голы. Ничья и ситуации с отставанием в счете имеют сопоставимую среднюю остроту удара, между ними меньше разрыв по конвертации условий в конечный результат, однако в остальном разница в пользу более благоприятного исхода сохраняется.
Схожим образом соотносятся показатели при рассмотрении отдельно «биг-шансов Тэйлора» и ударов с весом 0,5 xG и выше. Единственное исключение – средний вес удара при ничейном счете ниже среднего веса при поражении для категории ударов с xG выше 0,35 xG. При этом разница между всеми показателями в целом менее существенна по сравнению с выборкой, где представлены все удары.
Из всех вышеописанных ситуаций наиболее интуитивно понимается скорее момент с повышением средней остроты удара при преимуществе в счете: команды, как правило, ведя в счете, более охотно отдают территорию, соперники атакуют более рискованно и меньше думают о защите от чужих контратак
Как итог – больше шансов на проведение быстрой атаки, где средний вес удара по воротам будет выше.
Объяснить несовпадение динамики по реализации в зависимости от счета и хода матча с описанными в книге Канемана результатами сложнее. Однако есть мнение, что проблема в меньшей «контролируемости» ситуации с явным голевым моментом или любым ударом в футболе по сравнению с гольфом: в нашем случае на успешность исхода, помимо непосредственно исполнения удара и объективных внешних условий, также оказывает влияние фактор сопротивления со стороны соперника.
Более управляемый момент – контроль территории. Кажется допустимым утверждать, что «чувствительность» команд к неприятному счету и потенциальной «потере» иллюстрируется через факт преимущества проигрывающих команд над имеющими преимущество в счете по наклону поля (доля игровых действий команды внутри финальной трети от общего числа действий команд в финальной трети) – 56% против 44%.
Брались данные матчей Ла Лиги, АПЛ и Серии А в сезоне 2022/23.
Интуитивно понятный момент, который в плане активности/эффективности команд при неудачном счете не передается на конвертацию ударов в голы.
Рис. 2. График с подробной разбивкой game state
Вторая иллюстрация дает сравнительно немного новой информации – снова отмечаем более высокую конвертацию xG и пост-шота в голы при преимуществе в счете. Внимание привлекает разве что отличие выборок с 0,35+ xG и 0,5+ xG от основной – такие удары были лучше конвертированы в голы относительно ожидаемого при отставании в один или два мяча, чем в три.
Парадокс «зоны неплохих моментов»
При взгляде на графики выше можно обратить внимание, что точки, обозначающие моменты, которые имеют вес 0,35 xG и выше и 0,5 xG и выше, сгруппированы более плотно, чем точки, которые характеризуют все удары. Кроме того, эти группы смещены левее вниз.
Стоит заметить, что на всей выборке на один ожидаемый гол приходится 0,89 гола, в то время как для ударов весом от 0,25 до 0,5 xG (77,7% от всех ударов выше 0,25 xG – «ядро» того, что мы называем голевыми моментами, 9,5% от общей выборки) это соотношение резко падает до 0,81.
Вполне можно допустить, что мы получили артефакт от модели, причем конкретной (Wyscout) – у более сильной модели от Statsbomb есть значительные проседания по соотношению реальных и ожидаемых голов в областях от 0,05 до 0,15, 0,35 до 0,45 и 0,65 до 0,75 xG. То есть, имеется пересекающаяся с моделью Wyscout область, но нет такого акцента на обозначенном выше отрезке.
При этом стоит понимать, что некоторыми моделями всё еще пользуется большое количество людей (применимо и конкретно для Wyscout). При взгляде на реализацию того или иного игрока – что имеет смысл в плане проделывания конкретных выводов только на большой выборке – возможно, будет полезно сравнить не только голы, пост-шот и xG между собой, но и делить удары на группы, выделяя указанную выше категорию.
Интересный кейс изменения восприятия от завершения – пример Альваро Мораты в период выступления за «Челси» и в минувшем сезоне в «Атлетико». В АПЛ доля приведенных в пример ударов – от 0,25 до 0,5 xG – составила 24,5% от общего числа, в прошлом сезоне – 18,8% (что ниже среднего за пять лет). При этом разница в конвертации моментов огромна – с 0,77 до 1,1 гола на xG. Безусловно, далекоидущих выводов только по этим цифрам ввиду короткой дистанции по одному игроку не сделать, однако есть мнение, что в прошлом сезоне имелась взаимосвязь между сильнейшим в карьере Мораты завершением и стремлением «Атлетико» избегать кроссов.
Проект «Футбол в цифрах» проводил исследование, в рамках которого было доказано, что тренеры склонны предоставлять место в стартовом составе футболистам, которые в недавнем прошлом реализовывали «биг-шансы». Зрителям свойственно любить игроков, которые хорошо реализуют выгодные, по их мнению, моменты и со скепсисом относиться к тем, кто такими вещами похвастаться не может.
Общеизвестно, причем уже длительное время, что открывания, выход на ударную позицию (то есть завершение в широком смысле), а также действия вне завершения на высоком уровне дают больше полезной информации об уровне игрока, чем просто взгляд на его удары. С учетом изложенного смотрится справедливой идея также добавить в оценку завершения и более подробную информацию о типологии ударов.