0
读者
3
内容

全部文章
作者陈航头像

陈航

2023/05/23

德赫亚 12 年曼联生涯 400 多场英超比赛的数据可视化视频(第一期)

德赫亚已经在曼联十二年了,我花了一晚上时间,把他从加盟到现在的英超比赛数据整理了一下,决定做一些数据可视化来回顾一下。

德赫亚 12 年曼联生涯 400 多场英超比赛的数据可视化视频(第一期)

第一期是传球,包括传球的类型以及成功率,还有接球人。视频目的不是表扬或者批评他的能力,只是做一个回顾,他的一些数据变化,也能看到他的队友,教练的变化,也是曼联这十二年的变化。

如果有什么建议想法,或者感兴趣的数据,欢迎提出,我会抽时间给你制作!

这个视频,每张图都是十场比赛的数据:

1. 我将球场分为四个部分,横向用球门中线分割,纵向用球队防守动作的平均位置(也叫球队防线高度)分割,分别是 left back/left forward/right back/right forward

2. 根据传球的结束位置,将传球(包括失败)分到每个区域,每个区域的传球有自己的颜色,右上角是每个区域的传球落点占比。

3. 透明度低的传球代表失败传球,右下角是整体的传球成功率和长传成功率。

4. 我还展示了在每个区域接球次数最多的队友(太多回忆了)

5. 左上角是教练,还有一根纵向的红线,是球队防守动作的平均位置(也叫球队防线高度),可以看到球队战术的一些变化

下面是一些有意思的时期(这些图来自早期和朋友的讨论,所以样式和视频中的不太一样):

弗格森时期,左右两侧的瓦伦西亚和杨

索尔斯克亚时期,短传为主,前场的博格巴,以及 high defend line

索尔斯克亚时期,两个前场区域接球的是边后卫

穆里尼奥时期和他的费莱尼,伊布,博格巴,以及那会琼斯上场还挺多的

范加尔和费莱尼

作者陈航头像

陈航

2023/05/08

如何给球员评级?基于有球非传统算法的实践(1)

系列介绍

球员的评级从来没有标准答案,传统指标在解决这个问题时有各种问题,因为它们要么只关注罕见的行为,如射门和进球,要么忽略了行为发生的背景,如传球前是来自其他传球还是抢断。这里,我开始一个系列的文章,主要讲解一些论文里提出的思路和对比,并对他们的算法进行实现,基于 2022/23 赛季的数据,进行排名和拆解分析,并对比评级的算法结果和球迷/大V视角评价的区别。

第一篇我会尝试解释论文:Actions Speak Louder than Goals: Valuing Player Actions in Soccer,下一篇会根据实际的数据结果,来讨论算法的应用

Actions Speak Louder than Goals: Valuing Player Actions in Soccer

概括

大多数现有的评估足球行动的方法存在三个重要的局限性。

  1. 很大程度上忽略了除进球和射门之外的其他动作,因为到目前为止,大多数工作都集中在进球预期价值的概念上。

  2. 其次,现有的方法倾向于给每个动作分配一个固定的值,而不管该动作是在什么情况下完成的。例如,许多基于传球的指标对防守方在没有任何压力的情况下的传球和进攻方在对手重压下的传球进行类似处理。

  3. 第三,大多数方法只考虑即时效果,而没有考虑到一个动作在稍后的时间内的效果。

为了帮助填补客观量化球员表现的空白,本文提出了一个新的数据驱动的框架,以评估足球比赛中的行动。与大多数现有的工作不同,它

  1. 包含了所有类型的动作(例如,传球、过人、运球、接球和射门),

  2. 并考虑了这些动作发生的环境以及它们可能的长期影响。

  3. 直观地说,一个行动的价值反映了该行动对比赛结果的预期影响。也就是说,一个价值为+0.05的行动预计将为实施该行动的球队带来0.05个进球,而一个价值为-0.05的行动预计将为他们的对手带来0.05个进球。

这个框架就是 VAEP(Valuing Actions by Estimating Probabilities)框架。

算法拆解

VAEP(Valuing Actions by Estimating Probabilities)是一种数据驱动的框架,用于评估足球比赛中的行动。它考虑所有类型的行动(例如传球、过人、射门等),并考虑每个行动发生的环境以及可能的长期效果。行动的价值反映了该行动对比分的预期影响。

VAEP的核心思想是,大多数足球比赛中的行动都是为了(1)增加进球的机会,或者(2)减少失球的机会。因此,评估一个行动的效果的一种方式是计算它在近期内如何改变进球和失球的机会。VAEP将行动的影响分为进攻价值和防守价值两部分,这两部分可能是不对称的,并且取决于上下文。

具体来说,假设我们有每个比赛状态Si = [a1, ..., ai]的进球和失球的概率,其中h代表主队,v代表客队。Pscores(Si,h)和Pconcedes(Si,h)分别表示主队h在近期内进球和失球的概率。同样,Pscores(Si,v)和Pconcedes(Si,v)表示客队v在近期内进球和失球的概率。

对于一个队伍来说,评估一个行动的价值需要评估行动ai将比赛从状态Si-1变为状态Si后,进球和失球概率的变化。队伍x(可以是主队h或客队v)进球概率的变化可以计算为:

∆Pscores(ai,x) = Pscores(Si,x) - Pscores(Si-1,x)

这个变化如果为正,表示该行动增加了队伍x进球的概率。我们称这个变化∆Pscores(ai,x)为行动ai对队伍x的进攻价值。同样,队伍x失球概率的变化可以计算为:

∆Pconcedes(ai,x) = Pconcedes(Si,x) - Pconcedes(Si-1,x)

这个变化如果为正,表示该行动增加了队伍x失球的概率。然而,所有的行动都应该旨在减少失球的概率。这就是为什么我们称这个变化的相反数-∆Pconcedes(ai,x)为行动ai对队伍x的防守价值。

我们将公式1和公式2结合起来,得到一个行动的总VAEP值。行动的总VAEP值是该行动的进攻价值和防守价值的和:

V(ai,x) = ∆Pscores(ai,x) + (-∆Pconcedes(ai,x))

如何给球员评级?

VAEP框架为每个行动分配一个值,我们可以将这些单个行动的值聚合成球员的评级。这个评级可以在多个时间粒度以及多个不同的维度上进行。球员的评级可以针对任何给定的时间框架进行,最自然的包括比赛中的一个时间窗口、一场完整的比赛或者一个完整的赛季。无论时间框架如何,我们都以相同的方式计算球员的评级。由于在场上的时间越长,有机会贡献的机会就越多,我们按每90分钟的比赛时间计算球员的评级。

给定时间框架T和球员p,我们计算球员的评级为:

ratinд(p) = 90/m * ∑ai ∈ATp V (ai)

其中,ATp是球员p在时间框架T内执行的行动集,V (ai)根据定义1计算,m是球员在T期间比赛的分钟数。这个球员评级捕捉到了球员每90分钟对球队平均净进球差的贡献。

此外,除了对所有行动进行求和,还可以按行动类型计算球员的评级。这允许构建一个球员的个人资料,可能有助于识别不同的比赛风格。总的来说,球员的评级可以根据使用情况沿着不同的维度进行计算。

作者陈航头像

陈航

2023/05/01

专栏导览

这几年转会猫应该是我唯一公开的东西,但我更多的时间都在一些分析和数据上,除了自己开发的数据内容,也包括分析类文章/论文。所以开这个专栏,大概有如下内容:

国内甚至世界独......