수업 일지

[Python Analysis] EPL 데이터 분석을 통한 토트넘 연대기 1

cort53 2025. 2. 12. 11:28

축구에 관심이 많던 나는 17년도 토트넘의 전성기라고 할수 있는 시즌부터 축구를 보기 시작했다.

평소 축구 하는것에 좋아했고 보는것엔 크게 관심이 없었다.

당시 군인이었고, 주말이 지나고 월요일 개인정비 시간이 되면 사지방에 들어가 축구 뉴스를 보는게 일상이었다. 

그때부터 해외축구를 뛰는 선수인 손흥민 경기를 늘 하이라이트로 봐왔었고, 토트넘이라는 팀에 대해 알게 된다. 

 

내가 볼 시즌에는 포체티노 감독이 이끄는 DESK 라인이 고점을 찍고 있었으며, 이 콤비는 토트넘을 리그 준우승까지 이끌었다.  

 

DESK 라인 :토트넘 홋스퍼 FC의 공격진이었던 델리 알리(Dele Alli), 크리스티안 에릭센(Christian Eriksen), 손흥민(Son Heung-min), 해리 케인(Harry Kane)을 한데 묶어 부르는 신조어이며, 팀 내 강한 공격라인을 구축했다. 

 

하지만 사람들이 크게 관심있어하는건 챔피언스리그 이다. 나 역시도 그렇다. 

어릴때 축구를 안봤어도 챔스 결승이나 재밌는 매치는 꼭 챙겨서 봤다. 

18년도 토트넘은 챔스 준우승을 하게된다. 특히 4강전 아약스 전을 이긴 암스테르담의 기적을 이끈 루카스 모우라의 세 골은 아직도 잊을 수가 없다. 

 

암스테르담의 기적은 2018-19년 UEFA 챔피언스리그 4강 2차전 암스테르담 소재 요한 크루이프 아레나에서 토트넘이 아약스를 상대로 3-2, 합산 3-3 (원정 다득점 우세)으로 결승에 진출한 사건이다. 이 경기에서 아약스는 전반에 2-0으로 앞서갔으나, 후반 루카스 모우라에게 해트트릭을 허용하여 결승 진출에 실패하였다. 

 

 

그 경기를 본 나는 손흥민 덕분에 토트넘이라는 팀에 대해 알게 되었지만 루카스 모우라가 이끈 챔스 4강전 이후 토트넘이라는 팀에 완전한 팬이 되었다. 

 

BUT  다음 시즌이후로 팀 성적은 점점 내려가게 된다. 챔스 결승을 이끌었던 포체티노 감독이 경질이 되고, 무리뉴, 누누, 콘테.. 지금의 포스테코글루감독까지 왔지만 예전만큼 좋은 실력은 나오질 않는다. 

이유가 무엇일까.. 각 EPL 팀마다 팀 분석가들이 있어 매년 전술을 다르게 가져간다는데, 토트넘은 전술 분석을 하나 늘 궁금했다. 

 

그래서 직접 kaggle 데이터를 가지고 팀에 대한 연혁, 우승에 필요한 승점과 득점, 챔스를 갈 확률에 대해 분석을 해보았다. 

 


 

문제정의 -> 가설검증 -> 결론도출을 목적으로 방향성을 잡았다. 

간단한 내용은 데이터 분석을 통해 토트넘이 우승을 하려면 총 몇점의 승점을 얻어야하는지 챔스권의 진출 승점과 우승 or 챔스 진출 확률을 분석할 것이다. 

 

 

분석자료:

데이터 분석을 하기 위한 데이터는 kaggle에서 가져왔다. 

https://www.kaggle.com/datasets/evangower/english-premier-league-standings 

 

Premier League Standings 1993-2024

League standings of every English Premier League season

www.kaggle.com

이 데이터는 EPL 1993~2024년도 까지의 시즌 별 데이터가 있다. 

 

 

 

shape :  646 rows x 23 columns

 

columns:

season_end_year: 시즌 종료 연도
team: 팀 이름
position: 리그에서 팀의 순위
played: 시즌 동안 경기를 치른 횟수
won: 승리한 경기 수
drawn: 무승부 경기 수
lost: 패배한 경기 수
gf: 팀이 득점한 골 수 (goals for)
ga: 팀이 실점한 골 수 (goals against)
gd: 골 차이 (goal difference), 즉 득점한 골 수에서 실점한 골 수를 뺀 값
points: 팀이 얻은 총 점수. 승리는 3점, 무승부는 1점, 패배는 0점
notes: 리그 끝나고 팀에 대한 추가 설명. 
           예를 들어, '→ Champions League via league finish'는 해당 팀이 리그 순위로 챔피언스리그에 진출

 

라이브러리: Pandas, matplotlib, seaborn 사용


pl-tables-1993-2024.csv / 데이터 이미지는 이렇게 생겼다.

 

1) 손흥민이 입단한 시즌(2015~)부터 토트넘의 승리, 무승부, 패바한 경기 수가 어떻게 되는지 데이터 시각화

2) 2015년부터 24년도까지 토트넘의 득점한 골수, 실점, 골차이 승점 등 

 

epl 전체 팀에서 토트넘만 추출 / 년도 범위 지정
15~19년도까지는 4번의 챔스와 2번의 유로파 역대 최고 전성기라고 할 수 있다. (당시 감독: 포체티노)

 

16-17시즌 리그 준우승 승점은 역대 최고 point를 지칭한다.

 

✅ 17년도 리그 준우승과 18-19시즌 챔스 준우승을 기점으로 승점은 점점 떨어지고 있다. 

 

✅ 떨어지는 이유가 무엇이고, 우승하기 위한 gf(득점),ga(실점),gd(득실차) 의 점수와 토트넘이 챔스를 갈 확률은 얼마나될까?

 

 


 

Q. 우승을 하려면 총 몇점의 승점을 얻어야하는지 챔스권의 진출 승점과 우승 or 챔스 진출 확률을 분석

 

-> 먼저 모든 년도의 우승 팀들을 조회하고 시즌마다 우승팀 승점에 대해 통계자료를 분석할것이다.

데이터프레임 형식으로 만들어준다.

 

 

 

 

 

최고 승점 = 우승 / 팀별로 우승 횟수를 뽑았다.

 

 

다음으로 우승을 하려면 최소 승점은 얼마나 나와야되는지 분석해보았다. 

 

📈 통계자료에서 중요하게 본 것은 최솟값, 중앙값, 평균이다.

 min은 최소 75점이상은 되어야 우승할 가능성이 있다고 보여준다. 
 75점이 안된다면 우승은 바라보지 못한다고 봐야된다. 
 mean과 50%(중앙값)에서 보여주는 것은 87점~89점 정도 되면 우승이라는 수치를      보여준다.  

손흥민입단 (2015~) 부터 우승하기위한 최소 승점을 가진 시즌은 17,18 2시즌밖에 없다.

 

 

 

 

 

 

우승한 팀들의 데이터를 기반으로 득점수(gf), 실점수(ga), 득실차(gd)를 분석해봤다. 

 

득점수(gf), 실점수(ga), 득실차(gd)의 평균값을 알 수 있다고 판단했다. 

#gf의 평균(min값)
(68.0+80.0+72.0+68.0+85.0+83.0+67.0) / 7 = 74.71428...

 

#ga의 평균(max값)
(36.0+39.0+33.0+36.0+33.0+37.0+45.0) / 7 = 37.0

 

#gd의 평균(min값)
(35.0+41.0+41.0+32.0+52.0+51.0+32.0)/7  = 40.571428...

 

=> 총 결론최소 득점은 74점, 실점은 37점, 득실차는 40점 정도 차이가 나야 우승 가능성이 있다. 

지금 진행되고 있는 25년(25.02.12기준, 14순위)도 토트넘의 기록을 보면 총 27경기 gf:48, ga:37, gd:11 총 38라운드까지 앞으로 11라운드 남았다. 

우승까지 최소점을 가려면 26점(대략 9승 필요)

긍정적인 요소는 득실차가 적다는점 그러나 많이 넣고, 많이 먹힌다. 

14위 강등권 위기인걸로 보아 골득실이 순위와 상관관계가 있긴하지만 높은 상관관계수준은 아닌것 같다. 

 

사실상 우승은 바랄수도 없다. 내가 바란건 챔스권이다. 그럼 챔스에 진출하기 위해 필요한 점수는 어떻게 될까? 

다음 포스팅에서..!

'수업 일지' 카테고리의 다른 글

9주차 정리  (0) 2025.02.15
[Python Analysis] EPL 데이터 분석을 통한 토트넘 연대기 2  (0) 2025.02.12
8주차 정리  (0) 2025.02.10
5주차 정리  (0) 2025.01.18
4주차 정리  (2) 2025.01.11