Eerder deze week gooide ik wat cijfers bij elkaar de waarde van productieve outs. Ik concentreerde me op Corbin Carollen terecht: zijn elektrische vaardigheden zijn een perfect startpunt om uit te leggen hoe hitters waarde kunnen toevoegen (of aftrekken) ten opzichte van het gemiddelde, zelfs als ze een nul maken. De bal in het spel brengen? Wij zijn er dol op. Dubbelspel vermijden? Wij houden daar ook van. De Diamondbacks zijn een team vol speedsters, en de productieve outs van Carroll gaven hun honklopers de kans om met hun wielen te pronken.
Een snelle opfriscursus: ik heb het verschil in runscoreverwachting berekend tussen de gemiddelde nul en een specifiek type nul (strikeout, air out, non-GIDP groundout, dubbelspel) voor elke honk/uit-status. Vervolgens liet ik in 2024 een computerprogramma-tag maken met dat verschil. De gemiddelde nul die wordt gemaakt met een loper op het tweede honk en nul nullen kost teams bijvoorbeeld 0,35 punten aan scoringsverwachting in 2024. Groundouts kosten in die situatie slechts 0,25 punten, een verschil van 0,1 punten.
Dus bij elke groundout die plaatsvond met een loper op het tweede honk en geen nul, liet ik de computer ‚plus 0,1‘ noteren voor de waarde van ‚productieve nul‘. Een strikeout in die situatie verlaagde de scoringsverwachting daarentegen met 0,43 punten, een verschil met het gemiddelde van -.09 punten. Dus noteerde de computer ‚minus 0.09‘ voor elke strikeout met een loper op het tweede honk en geen uit. Doe dit voor elke combinatie van basis/uit-status en uit-type, tel alles bij elkaar op en je kunt de totale waarde van de productieve outs van een speler berekenen.
Ik zeg speler, maar dat is niet de enige manier om de gegevens te segmenteren. Met een beetje handigheid (lees: een paar regels code) heb ik de gegevens opnieuw gecategoriseerd op team in plaats van op speler. Ik deed dit om één belangrijke reden: ik wilde zien hoe belangrijk dit lijkt te zijn. Als je naar een lijst met individuele spelers kijkt, is het moeilijk te begrijpen hoe dat zich verhoudt tot het grotere geheel. Misschien staat Carroll bovenaan de lijst omdat hij de beste kansen had om “goede” outs te maken. Misschien heeft de man die na Carroll sloeg het dubbelspel behaald en alle positieve waarde ongedaan gemaakt. Met andere woorden: één persoon is misschien niet representatief voor het geheel.
Alleen al de outs van Carroll waren voor de Diamondbacks 8,5 runs meer waard dan je zou verwachten als je alle outs hetzelfde zou behandelen. Hoe zit het met alle outs die Arizona heeft opgenomen, van iedereen? We hebben het over speedsters met groundball-neigingen zoals Carroll, zoals boom-or-bust-sluggers Eugenio Suarezzoals stampers Christelijke Walker en parttime back-up catchers zoals Tucker Barnhart. Heb je een vermoeden?
Het antwoord is 12,3 runs. Minder dan je had verwacht? Het is zeker minder dan ik dacht. Er zitten zoveel geweldige honklopers in dat team! Maar dat is niet precies waar deze statistiek over gaat. Er wordt rekening gehouden met honklopen op basis van wat er feitelijk gebeurt: extra vooruitgang en het vermijden van outs op de basispaden, enzovoort. Hier kennen we alleen krediet toe aan de slagman op basis van de gemiddeld resultaat van een vangbal of wat dan ook, dus het geweldige honklopen heeft nooit invloed op deze statistiek, die ik in mijn spreadsheets OAR (out Advance Runs) noem om te voorkomen dat ik er elke keer een nieuw woord soepnaam voor moet verzinnen vermeld het.
Dat wil niet zeggen dat de twee niet gecorreleerd zijn. Er is een r-kwadraat van 0,26 tussen honklopen op teamniveau en OAR op teamniveau. Het gaat hier niet om het tweemaal tellen van hetzelfde spel, maar om het is over complementaire vaardigheden. Carroll is daar een goed voorbeeld van. Zijn productieve out-exploits voegen per definitie niets toe aan zijn honkloopscore, maar zijn razendsnelle snelheid zorgt ervoor dat hij in beide uitblinkt. Het is geen 1:1 situatie. Snelle spelers die regelmatig uitvallen (Luis Robert jr.bijvoorbeeld) eindigen vaak met een positieve honkloopwaarde maar een negatieve OAR. Juan Soto Niemand heeft het idee van snel, maar hij steekt de bal in de lucht en slaat niet uit, dus hij heeft een negatieve honkloopwaarde en een positieve productieve outwaarde. Over het algemeen hebben goede honklopers echter de neiging om productievere nullen te maken.
De Diamondbacks waren op dit vlak trouwens niet de beste ploeg in de competitie. Ze werden derde, hoewel de top vier allemaal tussen 11,1 en 13,2 waarderuns eindigden. Eerste plaats? Dat zouden de Detroit Tigers zijn. Zij waren hier het platonische ideaal. Ze brachten de bal vrij vaak in het spel als ze RBI-kansen hadden, vermeden dubbelspel, en hoewel hun strikeout-percentage over het geheel genomen hoog was, was het aanzienlijk lager met lopers op en minder dan twee nullen. Ik weet niet zeker of dat een vaardigheid is, maar het zou zeker kunnen; spelers veranderen absoluut hun aanpak op basis van de situatie, en of de Tigers het nu expres deden of niet, ze werden veel meer contactgelukkig als de situatie daarom vroeg.
Voor wat het waard is: de Tigers waren ook een uitstekend honkloopteam, tenminste als je steals buiten beschouwing laat. Ze werden tweede in niet-steal baserunning-waarde en 24e in toegevoegde waarde via het gestolen honk. Aan de andere kant eindigden de Orioles als tweede in teambrede OAR ondanks middelmatig honklopen. Ze kwamen eenvoudigweg nooit tot dubbelspelen; hun 71 dubbelspelen waren met anderhalve kilometer het laagste in de majors (15 dubbelspelen).
De andere kant van de medaille is ook interessant. Yankees-fans, je kunt het toegeven: je denkt dat je team als laatste is geëindigd. Aäron Rechter stond tenslotte als laatste op het individuele klassement, en hij was bepaald niet de enige Yankee met een dubbelspelprobleem; in totaal kwam het team er vorig jaar 138 tegen. Maar de Yankees zijn niet zo treurig als je zou verwachten; ze eindigden als 27e in de majors met -9,5 uit voortgangsruns. Dat is slecht, maar niet zo erg. Rechter zelf eindigde met -8,8.
Dat is om een paar redenen. Ten eerste waren de Yankees behoorlijk goed in het vermijden van strikeouts in situaties met een hoge schuldenlast. Met lopers op de honken en minder dan twee uit hadden ze slechts 19,1% van de tijd drie slag. Dat komt bijna overeen met het doel van Arizona, en het helpt al het dubbelspel te verklaren: ten goede of ten kwade, ze brachten de bal in het spel. Die dubbelspelen zijn ook misleidend. De Yankees hadden meer kansen om tot een dubbelspel te komen dan enig ander honkbalteam, omdat ze zo vaak lopers op de honken hadden. Hun slagingspercentage in dubbelspelen lag halverwege het gemiddelde tot het slechtste in de competitie; met andere woorden, er is hier sprake van een discrepantie tussen de cijfers en de tellingen, waardoor ze er verschrikkelijk uitzien in plaats van alleen maar slecht.
Nee, het slechtste team in honkbal als het gaat om het maken van productieve outs waren de Colorado Rockies. En ze waren de slechtste door a ton:
Onze voortgangsruns per team, 2024
Team | Onze voortgangsruns |
---|---|
DET | 13.2 |
BAL | 12.9 |
ARI | 12.3 |
CHC | 11.2 |
KCR | 9.8 |
TEX | 8,0 |
STL | 6.6 |
PIT | 5.9 |
MIA | 3.5 |
PHI | 3.3 |
CIN | 3.0 |
SDP | 3.0 |
CLE | 2.9 |
TOR | 1.1 |
MIL | 0,5 |
TBR | -0,1 |
NYM | -0,4 |
SFG | -0,7 |
HOU | -3.1 |
LAA | -3,7 |
JONGEN | -4,5 |
ATL | -4,5 |
BOS | -4,9 |
WSN | -6,9 |
CHW | -7,1 |
EIK | -8,8 |
NYY | -9,5 |
MIN | -9,8 |
ZEE | -12,2 |
KOL | -21.1 |
Ew. Weet je hoe ik zei dat het dubbelspel van de Yankees er qua tarieven niet zo slecht uitzag? Colorado zag er verschrikkelijk uit. De Rockies sloegen 126 dubbelspelen, de vierde plaats in honkbal. En ze deden het in de vijfde…minste mogelijkheden. Het is eerlijk gezegd moeilijk te doorgronden; Ondanks dat ze in een aanvallend paradijs speelden, hadden ze veel moeite om lopers op de honken te krijgen. Toen het ze lukte, speelden ze een dubbelspel met een toonaangevend tempo. Oh ja, ze kregen ook het vijfde hoogste aantal strikeouts in de competitie, terwijl de strikeouts op hun slechtst zijn (lopers op, minder dan twee nullen). Weet je hoe moeilijk het is om zoveel dubbelspelen te spelen als je ook voortdurend drie slag gooit? Het is ongelooflijk moeilijk.
De Rockies waren niet geheel ongelukkige honklopers. Ze waren een van de slechtste teams in de competitie wat betreft het stelen van honken, maar dat is iets anders; als het gaat om het vooruitgaan en het vermijden van outs, waren ze ongeveer gemiddeld. Het vertaalde zich eenvoudigweg niet naar de plaat, waar hun outs zo onproductief waren als je je kunt voorstellen – en mogelijk meer dan je je kunt voorstellen. Twintig runs is een ton!
De volgende vraag dringt zich op: Hoe zijn productieve outs, zoals gemeten door OAR, gecorreleerd met daadwerkelijke puntentelling? Om dat te testen, ben ik begonnen met het maken van gewogen runs. Ik heb het niet aangepast voor het stadion, omdat gescoorde runs ook niet aangepast zijn voor het stadion. Vervolgens voegde ik honkloopruns toe, zoals gemeten aan de hand van Statcast’s metingen van honkloop en honkstelen. Dat leverde mij een “verwacht” aantal gescoorde punten op, gemeten aan de hand van contextneutrale aanval en honkloopvaardigheid.
Van daaruit vergeleek ik de verwachte gescoorde runs met de daadwerkelijk gescoorde runs. Vervolgens heb ik de residuen vergeleken met mijn maatstaf voor runs van productieve outs. Helaas was de correlatie niet enorm; we hebben het over een r-kwadraat van ongeveer 0,075. De beste manier om daarover na te denken als je niet diep in een statistiekboek zit, is dat grofweg 7,5% van de variatie in “onverklaarde” puntentelling (zoals in het verschil tussen daadwerkelijk gescoorde punten en de som van wRC en honklopen) ) kan worden verklaard door productieve uitwaarde. Met andere woorden: heel weinig van de over- of onderprestaties van teams in de aanval worden verklaard door hoe productief hun outs zijn.
Dat is misschien een teleurstellend resultaat, maar als ik er verder naar kijk, is het voor mij logisch. De Rockies scoorden daadwerkelijk meer loopt dan je zou verwachten op basis van hun componentnummers, ondanks hun verschrikkelijke OAR. Dat komt omdat ze beter slaan met lopers in scoringspositie dan zonder. Nog beter sloegen ze met lopers in scoringspositie en twee uit. Productieve outs zijn veel minder betekenisvol dan het bereiken van de basis.
Dat roept een grote vraag op over mijn verantwoording voor productieve outs: zijn ze voorspelbaar? Er is voldoende onderzoek dat aantoont dat beter of slechter slaan met lopers in scoringspositie niet lastig is; uw splitsing in het ene jaar zegt niet veel over uw splitsing in het volgende jaar. Als de restwaarde van outs even luidruchtig is, is het meer een curiosum dan een bouwsteenstatistiek, goed om een verhaal te vertellen, maar slecht om te voorspellen hoe de toekomst zal verlopen.
Mijn antwoord? Kom later terug. De manier waarop ik mijn query in deze iteratie heb opgebouwd, zou veel sleutelen vergen om te generaliseren naar voorgaande jaren. Voor degenen die zich niet druk maken over de details, kun je de rest van deze paragraaf overslaan. Voor degenen die dat wel doen, heb ik een script geschreven dat de waarden voor elk paar base/out-status en out-type berekende, en deze vervolgens handmatig in een tweede script ingevoerd dat de gamelogboeken doornam en aan elke out een waarde toekende. Om de afgelopen jaren te kunnen doorlopen, zou ik óf heel veel handmatig werk moeten doen, óf het script zo moeten herschrijven dat de gewichten voor meerdere jaren worden berekend en die vervolgens op een meerjarige dataset worden toegepast. Het is haalbaar, alleen niet in mijn huidige opstelling, en ik ben nog steeds behoorlijk traag in het werken in SQL.
Maar hoewel dat misschien onbevredigend is, denk ik niet dat de algemene conclusie allesbehalve fascinerend is. Het zit zo: betere honkloopteams hebben ook de neiging om meer waarde uit hun nullen te halen dan de competitie als geheel. Ze vertonen ook een zwakke neiging om meer punten te scoren dan je zou verwachten op basis van hun slagwerk en honkloop. Het effect is niet enorm, maar het is duidelijk reëel. Het in het spel brengen van de bal en het uitsluiten van dubbelspel telt echt mee op het scorebord – alleen niet zo heel veel.
Source link