본문 바로가기
  • "You can't manage what you can't measure" Peter Drucker
728x90

R 히스토그램2

[Rstudio] histogram 히스토그램 with ggplot histogram (히스토그램) 히스토그램(histogram)은 표로 되어 있는 도수 분포표를 그래프로 나타낸 것이다. 계급 구간별 빈도수를 시각화하여 전체 데이트 분포를 파악하는데 유용하다. R이 값의 분포를 고려하여 계급 구간을 설정하고 계급 구간별 빈도를 기반하여 히스트그램을 생성한다. 계급 구간을 조정할 수도 있다. R 내장 데이터 : Faithful data 올드페이스풀 간헐천(Old Faithful Geyser in Yellowstone National Park in Wyoming, United States.) every 44 minutes to two hours since 2000 https://en.wikipedia.org/wiki/Old_Faithful eruptions : Eruptio.. 2023. 10. 10.
[R 기초] 기술통계 (논문 작성을 위한 세 번째 분석) 기술통계 주어진 데이터를 몇 개의 요약값으로 효과적으로 표현하는 방법이 기술통계 분석이다. 기술통계 값은 차후에 고차원 데이터 분석을 위한 준비과정이다. 기술통계 값은 (1) 분포의 중심을 나타내는 중심 경향 값, (2) 분포의 퍼짐 정도를 나타내는 산포도, (3) 분포의 모양을 나타내는 분포도로 나뉜다. 구분 분석 값 의미 기술통계 값 중심 경향 값 분포의 중심 평균, 중위수(중앙값), 최빈값 산포도 분포의 퍼짐 정도 표준편차, 분산, 범위, 사분위 범위 분포도 분포의 모양 왜도, 첨도 평균 (R 함수 : mean) 평균은 대표적인 통계 값이나, 극단 값(extreme valuse)의 영향을 받기 때문에 표본의 크기(관측값)가 작을 경우에는 몇 개의 극대값에 의해서 대표값 기능을 상실 할 수도 있다. .. 2023. 9. 26.
728x90