728x90 vitamin ymc6 Rstudio 데이터 살펴보기 #2 (summary 함수, 결측값 확인 등) 분석 데이터 (상북고_농구부.xlsx) (북산 - 나무위키 (namu.wiki) "5. 연재 당시 라인업" 정리, 학년은 나이로 반영) uniform_no name height weight blood type age position 4 채치수 197 90 A 19 C 5 권준호 178 62 A 19 SF 6 이달재 164 18 PG 7 송태섭 168 59 B 18 PG 8 신오일 170 18 PG 9 정병욱 180 18 SF 10 강백호 189 83 B 17 PF 11 서태웅 187 75 AB 17 SF 12 이호식 170 17 SF 13 이재훈 171 17 SG 14 정대만 184 70 A 19 SG 15 오중식 162 17 PG 데이터 요약해서 보기 library(readxl) #엑셀 파일을 불러오기.. 2023. 7. 28. Rstudio 데이터 불러오기/살펴보기 #1 관련 데이터 설명 2023년 1월 개봉한 "더 퍼스트 슬램덩크"에 나오는 상북(湘北 Shohoku, 쇼호쿠) 고등학교 농구부 선수들의 유니폼 번호, 이름, 키, 몸무게, 혈액형, 나이, 포지션 데이터를 사용하여 데이터 분석을 연습 [첨부파일 : 상북고_농구부.xlsx] 일본 원작의 이름은 쇼호쿠(湘北 / SHOHOKU: 상북) 비디오판에서는 한자를 그대로 우리말 독음으로 읽어 상북이라고 하고, 원작 단행본(한국판)에서는 북산이라고 하는 등 한국판 기준으로 이름이 다름 (출처 : 북산 - 나무위키 (namu.wiki)) (출처 : 더 퍼스트 슬램덩크 - 나무위키 (namu.wiki) ) 상북고_농구부.xlsx (북산 - 나무위키 (namu.wiki) "5. 연재 당시 라인업" 정리, 학년은 나이로 반영) .. 2023. 7. 27. Rstudio 엑셀 파일 불러오기/저장하기 엑셀 파일 불어오기 전, 확인사항 1. 엑셀 파일 상태 MS 엑셀에서 작업 중인 엑셀 파일은 R에서 불러 올 수 없으므로, 작업을 종료한 후에 불러와야 합니다. 2. 엑셀 파일 폴더 엑셀 파일이 작업 디렉터리에 있어야, 불러 올 수 있습니다. getwd()와 setwd()를 사용하여, 작업 디텍토리를 설정합니다. [참고] [R studio] 작업 디렉터리 (디렉토리, 폴더) 확인, 설정 변경 관리 (tistory.com) [R studio] 작업 디렉터리 (디렉토리, 폴더) 확인, 설정 변경 관리 작업 디렉터리 (폴더) 작업 디렉터리 (폴더) : 작업에 사용하고자 (읽거나 쓰고자) 하는 파일이 위치한 디렉터리 (폴더) R에서 어떤 파일을 읽으려면 그 파일이 위치한 디렉터리 (폴더)의 경로와 logisti.. 2023. 7. 26. 데이터 분석 #1 다년간 '4차 산업혁명', 'DT (Digital Transformation)', 'DX (Digital + X (cross, trans 의미의 X)라는 말이 다년간 유행해 왔다. Covid 19는 'Digital'의 힘을 더욱더 강하게 인식하게 된 계기가 되었다. 4차 혁명과 DX 시대의 핵심은 데이터에 있으며, 데이터를 잘 사용하는 것이 중요한 시대이다. 대부분 기업들은 ERP를 비롯한 정보 시스템을 통해서 데이터 축적은 이미 해오고 있다. 그러나, 이러한 Digital 시대에 "축적된 데이터를 어떻게 사용해야 할지"에 대한 고민은 부족했고, 데이터 분석에 사용하려고 보니, "사용할 가치가 있는 데이터가 부족"한 것이 현실이다. 알파고는 인간보다 바둑을 잘 두기 위해서 수 많은 기보를 학습했고, 인간.. 2023. 7. 22. 데이터 분석 프로그래밍 언어 #2 통계 소프트웨어 비교 #1 설명 SPSS - SPSS는 자료 분석에 통계 기법을 사용하여 의사 결정을 위한 분석 결과를 산출하는 통계 분석 소프트웨어 - 주로 가설 검정, 기술 및 예측 분석을 할 때 사용 - 기본적으로 제공하는 분석이나 검정 외에도 Python 및 R 프로그래밍 언저와 호환 사용이 가능 MS Excel - 엑셀은 다양한 수학점 함수를 지원 - z-분포, t-분포, 카이제곱 분포, F-분포, 회귀분석 등 간단한 통계 계산도 가능 - 다만, 자료가 늘어날수록 연산 속도가 급소도로 저하되어 표본 수가 많은 경우는 통계 분석용으로 활용하기 어려움 Python - 오픈소스 고급 프로그래밍 언어로, 기존의 프로그래밍 언어에 비해 문법이 간결하고 표현 구조가 인간의 사고 체계와 닮아 있어 초보자도 .. 2023. 7. 22. Rstudio 다운로드 및 설치 R 언어의 특징 데이터 분석에 특화된 언어 - R은 통계를 포함한 데이터 분석 목적으로 개발된 언어 - R은 다른 프로그래밍 언어와 다르게 컴파일 과정없이 바로 실행하여 결과 확인 가능 - 이러한 이유로 R로 작성한 것을 '프로그램'아 아니라, 'Script (스크립트)'라고 부름 다양한 패키지 - 업무 특성 및 데이터 분석 특성에 맞춘 함수들이 집합된 패키지 제공 - 머신러닝, chatGPT 연계 등 최신 기술을 접목한 패키지 제공 - 패키지는 개발되어 무류로 사용될 수 있도록 공유 (관련 매뉴얼 포함) 활발한 사용자 커뮤니티 - R 사용자들이 github, Rpubs 등을 통해 라이브러리 및 소스 공개 - Google에 관련 검색을 하면, 관련 블로그, 사이트가 많이 있음 (검색어 + 'in R') .. 2023. 7. 22. 이전 1 다음 728x90