Direct nadat FanGraphs werd gepubliceerd mijn stuk over de Kirby Indexverloor de naamgever van de metriek zijn gevoel. George Kirby’s handelsmerkcommando – zo betrouwbaar dat ik me op mijn gemak voelde om een statistiek naar hem te vernoemen – viel van een klif. Terwijl de loopsnelheid onder controle bleef, piekte de homerunsnelheid; hij stond in mei zeven homeruns toe, allemaal op worpen waar hij zijn doel met een aanzienlijke marge miste.
Het was een van de vele vernederende ervaringen bij het publiceren van dit verhaal om te zien hoe de naamgever van mijn nieuwe metriek middelmatig werd onmiddellijk na publicatie. Toch wilde ik het stuk opnieuw bekijken. Ten eerste is het december. En het schrijven van het verhaal bracht me in een fascinerend konijnenhol: hoewel ik ontdekte dat de Kirby Index zijn tekortkomingen heeft, leerde ik ook veel over de hedendaagse inspanningen om het commando over de werper te kwantificeren.
Maar eerst: wat is de Kirby Index? Ik ontdekte dat de loshoeken, in combinatie met de loshoogte en -breedte, bijna perfect de locatie van een toonhoogte voorspelden. Als deze twee variabelen je bijna alles zouden vertellen over de locatie van een werper, dan zou een meting van hun variatie voor individuele werpers theoretisch nieuwe informatie kunnen opleveren over het commando over de werper.
Dit maakte een paar mensen boos op Twitter, waaronder de vooraanstaande honkbalfysicus Alan Nathan en Greg Rybarczyk, de maker van de “Hit Tracker” en een voormalig lid van de frontoffice van de Red Sox. Deze twee – met name Rybarczyk – waren het niet eens met mijn gebruik van machinaal leren om deze voorspellingen te doen, met het argument dat mijn gebruik van machinaal leren suggereerde dat ik de feitelijke werking niet begreep van waarom een veld gaat waar het heen gaat.
‚Je zit precies goed, Alan,‘ schreef Rybarczyk. “De verbazing dat traject- en lanceerparameters sterk verband houden met waar de bal terechtkomt, kan alleen komen van mensen die trackinggegevens zien als kolommen met cijfers in plaats van metingen van de werkelijkheid die de onderliggende fysica weerspiegelen.”
Hoewel de toon een beetje overdreven was, had Rybarczyk een punt. Mijn “verbazing” zou zijn getemperd door een beter begrip van hoe Statcast de locatie berekent waar een veld de thuisplaat passeert. Na publicatie ontdekte ik dat de fit met negen parameters verklaart waarom de locatie van de toonhoogte zo krachtig kon worden voorspeld door de vrijgavehoeken.
De locatie van een toonhoogte wordt afgeleid van de beginsnelheid, het initiële loslaatpunt en de initiële versnelling van de toonhoogte in drie dimensies. (Dit zijn de negen parameters.) Loslaathoeken worden berekend met behulp van de beginsnelheid en het initiële loslaatpunt. Omdat de locatie van de steek en de loshoek beide zijn afgeleid van de 9P-passing, is dat logisch ze zouden bijna perfect gecorreleerd zijn.
Dit leidde tot redelijke kritiek: als loshoeken locatie-informatie in een andere vorm zijn, waarom zou je dan niet gewoon dezelfde techniek van het meten van variatie op de pitchlocaties zelf toepassen? Dit is een terechte vraag. Maar het gebruik van locaties zou de conclusie van dat Kirby Index-stuk hebben ondermijnd – dat biomechanische gegevens zoals vrijgavehoeken de nauwkeurigheid van commandometingen zouden kunnen verbeteren.
Teams konden, met hun toegang tot KinaTrax-gegevens, hun eigen versie van de Kirby Index creëren, niet met impliciete vrijgavehoeken afgeleid van de pasvorm met negen parameters, maar met de positie van polsen en armen vastgelegd op het moment van loslaten. Het Kirby Index-stuk ging niet alleen over het creëren van een nieuwe manier om commando te meten; Ik wilde dat het naar een specifieke manier zou verwijzen de nieuwe datarevolutie in het honkbal zou zich ontvouwen.
Maar genoeg daarover. Het is tijd voor de klassementen. Ik heb alle werpers met minder dan 500 fastballs verwijderd. Hier zijn de top 20 in de Kirby Index voor het seizoen 2024:
Kirby Index-leiders 2024
BRON: Honkbal Savant
Minimaal 500 fastballs gegooid.
En hier zijn de onderste 20:
2024 Kirby Index-achterblijvers
BRON: Honkbal Savant
Minimaal 500 fastballs gegooid.
Een paar afhaalrestaurants voor mij: ten eerste ben ik zo dankbaar dat Kirby het voor elkaar heeft gekregen en in de top drie is geëindigd. Dood, belastingen en George Kirby die fastballs gooit waar hij wil. Ten tweede zijn de boven- en onderkant van de ranglijsten bevredigend. Cody Bradford gooit 89 en leeft van zijn elitecommando, en Joe Boyle – nou ja, er is een reden de A’s gooiden hem erin als stuk in de Jeffrey Springs handel ondanks zijn buitenaardse dingen. Ten derde zijn er jongens op de lijst met achterblijvers – met name Seth Lugo en Miles Mikolas – die niet op hun plaats lijken.
Mikolas bleef het hele jaar onderaan de ranglijsten hangen, wat ik merkwaardig vond. Mikolas haalt tenslotte gemiddeld slechts 150 km/u op zijn fastball met vier naden; je zou je kunnen voorstellen dat zo iemand het elitecommando nodig zou hebben om een levensvatbare Major League-starter te blijven, en dat slechtste commando in de competitie zou feitelijk een doodvonnis zijn. Om dit nog verder te verwarren, vermeed Mikolas wandelingen beter dan bijna iedereen.
Waarom Mikolas zo slecht scoorde in de Kirby Index terwijl hij zo weinig slagmensen vrijliet, zou waarschijnlijk het onderwerp kunnen zijn van een eigen artikel, maar voor de doeleinden van dit verhaal is het waarschijnlijk genoeg om te zeggen dat de Kirby Index een aantal dingen over het hoofd ziet.
Een voorbeeld: Mikolas stond op de tweede plaats van alle werpers in armhoekvariatie bij fastballs met vier naden, wat suggereert dat Mikolas opzettelijk zijn armhoek van worp tot worp verandert, waarschijnlijk afhankelijk van of de slagman linkshandig of rechtshandig is. Dit is slechts één reden waarom iemand laag scoort in de Kirby Index. Een andere, zoals ik in het oorspronkelijke artikel al zei, is dat een werper als Lugo op zoveel verschillende doelen mikt dat hij een maatstaf als de Kirby Index voor de gek houdt.
Dus: de Kirby Index was een leuke oefening, maar er zijn enkele tekortkomingen. Wat zijn de alternatieven voor het meten van het werpercommando?
Locatie+
Locatie+ is de industriestandaard. De FanGraphs Sabermetric-bibliotheek (een ongelooflijke bron, dat moet gezegd worden) doet uitstekend werk bij het beschrijven van die statistiek, dus ik zou je willen aanmoedigen om klik op deze hyperlink voor de volledige beschrijving. De korte versie: Runwaarden worden toegewezen aan elke locatie en elk veldtype op basis van de telling. Elke pitch wordt beoordeeld op de stofneutrale locaties.
Impliciete locatiewaarde
Niemand lijkt bijzonder tevreden over Location+, ook niet de makers van Location+ zelf. Omdat elke telstatus en elk toonhoogtetype zijn eigen runwaardekaart gebruikt om runwaardecijfers te verdelen, duurt het superlang voordat de statistiek zich stabiliseert, met meer dan honderden toonhoogtes. Het is ook niet bijzonder plakkerig van jaar tot jaar.
De nieuwste versie van Location+, die ergens in de nabije toekomst zal debuteren, zal een soortgelijke logica gebruiken als het commandomodel van PitchProfiler. In wezen berekent PitchProfiler een Stuff+ en een Pitching+ voor elke werper, die zijn ingesteld op een runwaardeschaal. Door de Stuff+ runwaarde af te trekken van de Pitching+ runwaarde, keert het model terug naar de waarde die een werper alleen al door zijn commando krijgt.
klodders
Of het nu gaat om het meten van de standaarddeviatie van vrijgavehoekproxy’s of om de daadwerkelijke locaties van de pitches zelf, deze methode kan worden gedefinieerd als de ‚blob‘-methode, waarbij de clusterdichtheid van de gekozen variabele wordt beoordeeld.
Max Bay, nu senior kwantitatief analist bij de Dodgers, geavanceerde de Kirby Index-methode door het meten van de “betrouwbaarheidsellipsen” van de vrijgavehoek, waardoor een elegantere unificatie van de verticale en horizontale vrijgavehoekcomponenten mogelijk is.
Afstand missen
De centrale zorg bij de Kirby Index en alle blob-methoden is, zoals ik destijds al zei, de aanname van één doel. Idealiter zou, in plaats van te kijken naar hoe dicht alle werpers rond een enkel punt zijn geclusterd, elke worp worden geëvalueerd op basis van hoe dicht deze bij het eigenlijke doel eindigde.
Maar doelstellingen zijn moeilijk te behalen. SportsVision begon deze doelstellingen halverwege de jaren 2010 te volgen, onder de naam Eno Sarris beschreven in zijn stuk over de stand van het commandoonderzoek in 2018. Tegenwoordig meet Driveline Baseball dit samen met Inside Edge. Inside Edge zet mensen in om de doellocatie voor elke afzonderlijke pitch handmatig te taggen. Met deze gegevens bij de hand kan Driveline een aantal dingen doen. Eerst creëerden ze een Command+-model, waarbij de gemiddelde missafstanden werden aangepast door rekening te houden met de moeilijkheidsgraad van het doel en de vorm van een pitch.
Met behulp van bedoelde zonegegevens laat Driveline ook werpers zien waar ze precies moeten mikken om rekening te houden met hun misserneigingen. Er is mij verteld dat ze deze methodologie binnenkort in een openbare post zullen publiceren.
Catcherdoelen (computervisie)
In een perfecte wereld zouden computers mensen vervangen – wacht, laat me die zin nog eens proberen. Het is duur en tijdrovend om doelen handmatig via video te volgen, en daarom behoren gemiste doelgegevens niet voor niets tot degenen die bereid zijn de prijs te betalen. Computer vision-technieken bieden het potentieel om de gegevens goedkoop en (dus) democratisch te produceren.
Carlos Marcano en Dylan Drummey introduceerden hun BaseballCV-project in september. (Drummey werd kort daarna ingehuurd door de Cubs.) Joseph Dattoli, directeur spelerontwikkeling aan de Universiteit van Missouri, bood een bijdrage aan het project door te demonstreren hoe computer vision kon worden gebruikt om vangerdoelen te taggen. De enige beperking, zo merkte Joseph op, is de rekenkracht die nodig is om video van elke afzonderlijke toonhoogte te doorzoeken.
Er zijn enkele potentiële problemen bij elke commandometing die afhankelijk is van het volgen van doelen. Doelen zijn niet altijd echte doelen, het zijn eerder aanwijzingen voor de werper om in die algemene richting te gooien. Maar Joseph omzeilt deze zorg door zowel de handschoen van de vanger als zijn massamiddelpunt te volgen, dat minder gevoelig is voor dit soort dekes. Er is echter nog een weg te gaan voordat deze methode zich kan uitbreiden naar een vorm waarin dagelijkse klassementen toegankelijk zijn.
De Powers-methode
Bij gebrek aan een reeks openbare informatie over werkelijke werperdoelen, kan er in plaats daarvan een poging worden ondernomen om deze te simuleren. In zijn presentatie uit 2023, ‘Pitch trajectory density estimation for voorspellen future results’, stelde Rice-professor Scott Powers een methode voor om rekening te houden met de willekeurige variatie in toonhoogtetrajecten, en bood daarbij een raamwerk voor het simuleren van zoiets als een doelwit. (Ik zal waarschijnlijk zijn methoden afslachten als ik ze probeer samen te vatten, dus ik moedig je aan om dat te doen bekijk de volledige presentatie als je geïnteresseerd bent.)
De Powers-methode is gewijzigd door Stephen Sutton-Brown op Honkbalprospectusdie gebruikte Blake Snell als voorbeeld van de manier waarop deze targetingmodellen op schaal kunnen worden toegepast om individuele werpers te beoordelen. Ten eerste paste Sutton-Brown een model toe dat een globaal doel creëerde voor elk veldtype, waarbij het aantal en de handigheid van elke slagman werd aangepast. Vervolgens werd dit globale doel voor elke werper aangepast om rekening te houden met de neigingen van die werper. Met behulp van deze gesimuleerde doelen berekende hij hun gemiddelde missafstand, waardoor de runwaarde van de doelen van een werper gescheiden kon worden van de runwaarde van hun commandovaardigheid.
„Niets“
Op Twitter vroeg ik Lance Brozdowski wat hij zag als de gouden standaard voor commandovoering. Hij antwoordde: ‘Niets’, wat het probleem goed samenvat. Dit is een uitdagende vraag, en alle bestaande methoden hebben hun gebreken.
Er zijn manieren waarop de Kirby Index kan worden verbeterd, maar voor zover ik weet is de beste weg voorwaarts voor de meetgegevens van publieke commando’s een combinatie van de laatste twee methoden, met actieve monitoring van de vooruitgang op het gebied van computervisie om te zien of deze consistent is. doelstellingen kunnen worden vastgesteld.
Maar je zou je kunnen voorstellen dat het verhaal aan de teamkant compleet anders is. Door de KinaTrax-gegevens te combineren met informatie over de gemiste afstand, kunnen deze methoden mogelijk worden gecombineerd om een soort supermetriek te maken, een meting waarvan ik denk dat deze vrij dicht in de buurt komt van het meten van het werkelijke commandovermogen van Major League-werpers. (In een filmpje van woensdagBrozdowski rapporteerde over een deel van het potentieel van deze gegevens voor het meten en verbeteren van commandovoering, evenals hun beperkingen.) Het publiek is er misschien niet helemaal bij, maar voor zover ik weet, zijn we er niet zo ver vandaan.