Значение статистического анализа в футболе с началом 21 столетия растет из года в год, и мы с легкостью можем увидеть результаты этого как в СМИ, так и на самом футбольном поле.

– Здравствуйте, Дункан. Какова ваша роль в Opta? Что представляют из себя будни футбольной статистики?

– Я работаю в Opta уже более десяти лет, в основном с командой редакторов данных. На человеческом языке это значит, что мы принимаем огромные объемы необработанных данных, "просеиваем" их и получаем заключения по матчу, оформляем их в виде парочки запоминающихся строк для телевидения, газет, а с 2009 года – и для социальных сетей. В последнее время я пытаюсь найти новые способы использования данных, например, для конкретных проектов – таких, как ежегодник "Opta Joe".

– Что вы посоветуете читателям, которые мечтают заниматься спортивной аналитикой, особенно футбольной?

– Набор необходимых навыков со временем меняется. Я до сих пор в основном пользуюсь Excel-ем, как динозавр, а молодежь извлекает и работает с данными с помощью скриптов на Python-е. Хотя самое главное – это разбираться и любить футбол. Я бы мог взглянуть на список цифр по импорту краски или дефициту бюджета в Канаде, но они оставили бы меня равнодушным. А если дело касается футбола, у меня загораются глаза, эти цифры вдохновляют меня на интересные мысли, позволяют увидеть игру с новой стороны.

– Сколько людей одновременно задействованы в анализе самых важных матчей? Можете подробнее рассказать о процессе сбора данных?

– Даже несмотря на то, что Opta занимается этим уже 20 лет, многие все еще понятия не имеют, как мы работаем. По сути, процесс практически не менялся с 2006 года. Видео прогоняется через наше собственное программное обеспечение. Это позволяет двум людям (один на команду, плюс еще человек для контроля качества в режиме реального времени) отслеживать и записывать каждое касание к мячу в игре. В среднем за матч происходит около 2000 событий, их координаты фиксируются вживую. Вот неплохое видео о главных составляющих нашей работы: 

– Как считаете: скромным командам сложнее конкурировать с крупными на футбольном поле из-за уровня и качества сбора информации в крупных клубах?

– Я думаю, это играет куда меньшую роль, чем, к примеру, трансферный бюджет. Но всегда можно нанять продвинутого человека, который будет работать с собранными данными, помогая на равных тягаться с любым противником (пока его не уведет кто-то посерьезнее).

– Роль статистики в футболе со временем будет расти? Если да, то в каких сферах? Чего интересного стоит ожидать от индустрии аналитики в ближайшее время?

– Следующим шагом, скорее всего, станет сочетание разных видов информации. Если объединить позиционные данные с событиями, можно выяснить, кто точнее отдает передачи под давлением, чья защита была хуже, какой нападающий стабильно находит пространство перед ударом. Это будет что-то вроде футбольной статистики v.2.0.

– С какой вероятностью статистика позволяет предсказывать исход будущих матчей? Любителям ставок стоит повнимательнее относиться к результатам вашей работы?

– Как обычно, числа нужно толковать с умом. Команда X могла выиграть предыдущие пять матчей у команды Y, но если последний из них проходил на Boxing Day 1931 года, то толку от этой статистики нет. Зато если команда X не выиграла ни одного из 14 матчей, которые в этом сезоне пропустил игрок A, и сегодня A не выйдет на поле, то это обязательно стоит принять во внимание.

– У вас очень много подписчиков в Твиттере, тысячи пользователей репостят ваши сообщения. В чем секрет такого успеха в социальных сетях?

– Многие считают, у Твиттера какое-то великое предназначение, но на самом деле для нас это всегда был просто способ поделиться информацией, которую еще нигде не опубликовали и напрямую взаимодействовать с болельщиками (узнавать, что им нравится, а что нет). В конце концов, большинство людей не очень-то жалует сложные статистические показатели, но если статистику представить в понятном виде, чтобы ее удобно было использовать, например, в спорах с друзьями, то всем это идет только на пользу. А кое-кто не любит итоги в виде одного слова, которые мы добавляем в конце твитов; но эти слова часто могут сделать довольно-таки банальную информацию более забавной, не превращая все в чисто субъективное мнение.

– Если бы вам предложили выбрать ваши любимые статистические показатели в сезоне 2015-2016, что бы это было?

– Во время написания книги мне пришлось просеять много статистики, очень много. Один показатель не попал в конечный вариант издания, но мне он нравился: игроки Премьер-лиги чаще получали красные карточки в полнолуние. А в апрельском матче Кристал Пэлас и Норвича мяч находился в игре всего 45 минут и 39 секунд. Так что если вы любитель аутов, офсайдов и ударов от ворот, Пэлас — Норвич – для вас это будет просто классика жанра.

The Boot Room