-
"You can't manage what you can't measure" Peter Drucker
Rstudio 데이터 살펴보기 #3 (기술통계 및 데이터 분포 해석)
평균과 중앙값의 관계 데이터가 한쪽으로 치우쳐져 있을 때, 평균과 중앙값의 값이 다를 수 있음 즉, 중앙값과 평균의 위치에 따라, 데이터의 분포 형태를 구분할 수 있음 평균과 중앙값의 차이가 크다면, 데이터가 한쪽으로 치우친 경향이 있을 수 있음 치우친 방향 쪽으로 중앙값이 평균보다 더 가까워지는 경향이 있음 이는 치우친 데이터로 인해 평균이 영향을 받아 평균 값이 중앙값 쪽으로 편향될 수 있음을 의미함 - 평균이 더 큰 경우: 오른쪽으로 치우친 (Positive Skewed) 데이터 분포일 가능성이 높음 데이터의 값이 좀 더 높은 쪽에 몰려 있으며, 상대적으로 작은 값들이 평균을 낮추기 위해 왼쪽으로 늘어나며, 이러한 경우, 평균은 중앙값보다 더 큰 값을 가짐 예제 데이터: {1, 2, 3, 4, 10..
2023. 7. 30.