CSAS 2025 데이터분석 챌린지: (원문 링크)
이번 CSAS 데이터 챌린지의 목표는 배트 스피드와 스윙 길이에 대한 새로운 야구 데이터를 활용하여 투수/타자 상호작용의 특정 측면을 분석하는 것입니다. 2024년 4월 2일부터 6월 30일까지의 346,250개의 메이저리그 타석에 대한 피치별 데이터를 Baseball Savant로부터 제공받았으며, 여기에는 관련 Statcast 데이터와 함께 추적된 스윙에 대한 배트 스피드와 스윙 길이가 포함되어 있습니다. 시즌 후반기 데이터는 정규 시즌 종료 후 추가될 예정입니다. 분석은 배트 스피드와 스윙 길이를 활용하여 타석에서의 타자, 투수, 또는 타자-투수 상호작용과 관련된 모든 주제를 연구할 수 있습니다.
홈런 시도에는 성공과 실패가 모두 포함되므로, 두 가지 기본적인 요인을 고려하기로 했습니다:
홈런 시도의 기준을 설정했으므로, 이제 타자의 홈런 시도를 판단하기 위한 각 요인의 threshold를 결정해야 했습니다. 이를 위해 다음 단계를 수행했습니다: