Homepagina Over mij Decompositie en adviezen Digitale veiligheid Gestructureerde data Representeren Rekenspel 1 Rekenspel 2 Identificeren Warmingstripes

Identificeren


import pandas as pd
import matplotlib.pyplot as plt

#lees het CSV bestand uit en controleer of de eerste kolommen overeen komen
df = pd . read_csv ('Voetbaldata 2023_2024.csv')
df.head()


#onderzoeks vraag: Zijn er meer doelpunten in de eerste of tweede helft van wedstrijden gemaakt?

df['Dphelft1'] = df['HTAG'] + df['HTHG']
df['Dphelft2'] = (df['FTAG'] + df['FTHG']) - (df['HTAG'] + df['HTHG'])

h1 = df['Dphelft1'].sum()
h2 = df['Dphelft2'].sum()

print("Doelpunten eerste helft:", h1)


Er zijn dus opvallend meer doelpunten gemaakt in de tweede helft van wedstrijden. Experts zeggen dat dat te verwijten is aan het moe worden van spelers, waardoor ze verdedigende fouten gaan maken. Ook lijken er mensen te zijn die denken dat de sociale druk op de spelers invloed kan hebben op de relatief grote hoeveelheid doelpunten die in de tweede helft worden gescoord. Dat is interessant omdat die trends te zien zijn in statistiek, maar de oorzaak niet vast te stellen is met statistieken als deze, waardoor het als een verzonnen oorzaak bij een gevolg gaat klinken.

Bron: Waarom worden er in de slotfase zoveel doelpunten gescoord? (z.d.) Inplay Football stats: Get Better Live Inplay Predictions.
https://playthepercentage-com.translate.goog/blog/what-time-are-goals-scored-in-football?_x_tr_sl=en&_x_tr_tl=nl&_x_tr_hl=nl&_x_tr_pto=rq


#onderzoeks vraag: Welke eindstand (bijv. 1-0, 2-1, 0-0) komt het vaakst voor?

df['Score'] = df['FTHG'].astype(str) + '-' + df['FTAG'].astype(str) #voegt de scores samen tot één waarde met beide scores en convert naar een string.

score_counts = df['Score'].value_counts() #maakt er een lijst van zoals gebruikt in C5.

score_counts.plot(kind='bar')
plt.xlabel('Score')
plt.ylabel('Aantal wedstrijden')
plt.title('Aantal keer een eindstanden')
plt.show()


In de hier bovenstaande grafiek heb ik de eindscores in een staafdiagram gezet waardoor al snel makkelijk is af te lezen welke scores het vaakst voorkomen. In de grafiek is vrij duidelijke trend te zien; de gelijke spelen 1-1 en 2-2 komen verreweg het vaakst voor. Dat is interessant omdat in de Eredivisie bij gelijkspel beide partijen een punt krijgen. Door gelijkspel te spelen win je zelf een punt, maar geef je ook een punt aan de ander. Echter blijkt ook dat winsten met weinig doelpunten vaak voorkomen, wat natuurlijk leuk is voor de voetbalkijkers omdat het zorgt voor spannende wedstrijden. Dus alhoewel voetbal liefhebbers vaak beweren dat hun team verreweg de beste is, zijn wedstrijden toch altijd een stuk spannender dat mensen misschien van tevoren hebben ingeschat, waardoor het leuk blijft om naar te kijken.


Dit is de link naar mijn Colab bestand voor als de code op de site niet werkt: https://colab.research.google.com/drive/1wCOV7-kO57u87TN_-eGNCq-MX5jiBoqZ?usp=sharing