728x90 R 스튜디오4 [Rstudio] Boxplot 박스플롯 (상자 수염 그림) with ggplot Boxplot (박스플롯) 박스 플롯( Box Plot )은 데이터의 분포와 중심 경향을 그래프로 나타 낸 것이다. 박스 플롯은 데이터의 다섯 가지 요약 통계량(최솟값, 1사분위수, 중앙값, 3사분위수, 최댓값)을 시각적으로 나타내며 이상치(outliers)를 식별하는 데도 유용하다. Rstudio 사분위수(Quartile) Outliers(이상치) Rstudio 사분위수(Quartile) Outliers(이상치) IQR (사분범위) (tistory.com) Rstudio 사분위수(Quartile) Outliers(이상치) IQR (사분범위) Rstudio의 summary 함수를 통해서, 1사분위수(Q1), 2사분위수(Q2, 중앙값) 3사분위수(Q3)을 확인 summary (slam_dunk) unifo.. 2023. 10. 15. [Rstudio tidyverse] dplyr 패키지 (group_by, summarize, arrange) dplyr 패키지 (group_by, summarize, arrange) group_by 및 summarize : 그룹화된 데이터에서 요약 통계량을 계산 group_by() 및 summarize() 함수는 dplyr 패키지의 중요한 기능 중 하나로, 데이터 프레임을 그룹화하고 각 그룹에 대한 요약 통계량을 계산하는 데 사용된다. summarize() 내 통계량 사용 함수 및 내용 평균 (Mean) mean(x): 열 x의 평균 값을 계산 중앙값 (Median) median(x) : 열 x의 중앙값을 계산 최댓값 (Maximum) max(x) 열 x에서 최댓값을 계산 최솟값 (Minimum) min(x): 열 x에서 최솟값을 계산 범위 (Range) max(x) - min(x): 열 x의 범위를 계산 표준.. 2023. 10. 8. [R studio] tidyverse 패키지와 특장점 tidyverse 패키지 tidyverse는 R 프로그래밍 언어를 사용하는 데이터 분석 및 시각화 작업을 단순화하고 향상시키기 위한 패키지 모음이다. tidyverse에 포함된 패키지는 데이터를 더 효과적으로 다루고 시각화하며, 코드의 가독성을 높이고 데이터 분석 작업을 더 편리하게 만들어 준다. tidyverse 포함 패키지 tidyverse 패키지를 설치하고 라이브러리로 불러오면, 아래 포함 패키지의 기능을 모두 사용할 수 있다. tidyverse 패키지 설치를 통해서 가장 많이 하는 데이터 분석의 대부분을 할 수 있다. (엑셀로 하는 데이터 분석을 엑셀보다 빠르고 쉽게 할 수 있다.) install.packages('tidyverse') library(tidyverse) > library(tidyv.. 2023. 10. 7. [R studio] 다른 디렉터리 (디렉토리, 폴더) 파일 불러오기 저장하기 하위 디렉터리는 './'로 이동하고, 상위 디렉터리는 '../'로 이동한다. 디렉터리를 직접 지정할 수도 있다. 하위 디렉터리(폴더) 파일 불러오기 setwd('C:/Rstudio') getwd() > getwd() [1] "C:/Rstudio" slam_dunk str(slam_dunk) 'data.frame': 48 obs. of 8 variables: $ uniform_no: int 4 5 6 7 8 9 10 11 12 13 ... $ name : chr "채치수" "권준호" "이달재" "송태섭" ... $ height : int 197 178 164 168 170 180 189 187 170 171 ... $ weight : int 90 62 NA 59 NA NA 83 75 NA NA ... $ .. 2023. 10. 7. 이전 1 다음 728x90