-
"You can't manage what you can't measure" Peter Drucker
야구의 특성 및 데이터 관리
야구는 다른 스포츠대비 데이터 기록과 분석이 중요한 경기 야구의 특성을 파악하기 전에, 구기 종목의 경기 방식 등 특성을 구분한다면, 구기 종목 (Ball sports) 특성 구기 종목을 경기 방식 등 특성에 따라 구분한다면, 팀 대 개인: 스포츠는 팀이 경쟁하는 종목과 개인이 경쟁하는 종목으로 나눌 수 있음 팀 : 축구, 야구, 배구, 농구, 하키 등 개인 : 테니스, 탁구, 골프 등 (물론, 복식 경기도 있고, 팀 대항전도 있음) 경기 장소(프로 스포츠 기준) : 스포츠는 경기를 치는 장소에 따라 나눌 수 있음 실외 경기장 : 야구, 축구, 골프 등 실내 경기장 : 농구, 배구, 탁구 등 골프는 여러 홀의 돌면서 경기 (각 홀의 경기장은 홀컵 위치 등이 다르게 구성되며, 대회마다 다른 규격의 경기장)..
2023. 8. 5.
Rstudio 데이터 살펴보기 #3 (기술통계 및 데이터 분포 해석)
평균과 중앙값의 관계 데이터가 한쪽으로 치우쳐져 있을 때, 평균과 중앙값의 값이 다를 수 있음 즉, 중앙값과 평균의 위치에 따라, 데이터의 분포 형태를 구분할 수 있음 평균과 중앙값의 차이가 크다면, 데이터가 한쪽으로 치우친 경향이 있을 수 있음 치우친 방향 쪽으로 중앙값이 평균보다 더 가까워지는 경향이 있음 이는 치우친 데이터로 인해 평균이 영향을 받아 평균 값이 중앙값 쪽으로 편향될 수 있음을 의미함 - 평균이 더 큰 경우: 오른쪽으로 치우친 (Positive Skewed) 데이터 분포일 가능성이 높음 데이터의 값이 좀 더 높은 쪽에 몰려 있으며, 상대적으로 작은 값들이 평균을 낮추기 위해 왼쪽으로 늘어나며, 이러한 경우, 평균은 중앙값보다 더 큰 값을 가짐 예제 데이터: {1, 2, 3, 4, 10..
2023. 7. 30.