728x90 분류 전체보기247 RStudio 환경 소개 및 주요 설정, 주요 패키지 소개 RStudio RStudio는 R을 사용하는 데이터 분석가와 데이터 과학자들에게 강력한 통합 개발 환경(IDE)으로서 R 언어를 사용하여 데이터 분석, 시각화, 통계 분석 등을 수행하는 데 최적화된 환경을 제공 좌측 상단의 스크립트 편집기(Editor) 여러 코드를 모아서 프로그래밍하고, 저장할 수 있는 공간 스크립트 편집기(Editor)는 Rstudio를 설치하고, 처음으로 오픈할 때는 나타나지 않으나, 신규로 파일을 작성하거나, 기존에 저장한 파일을 불러오면 활성화됨 코드를 실행할 수 있는 아이콘이 있음 (실행할 코드를 Ctrl + Enter로도 실행 가능) 한 명령문 실행 : 커서가 있는 줄에서 Ctrl + Enter 복수 명령문 실행 : 커서를 드래그하여 블록을 설정하고 Ctrl + Enter 모.. 2023. 7. 24. Rstudio CSV 파일 불러오기/저장하기 CSV 파일 불러오기방법 1data data # 변수 이름이 없는 CSV 파일 읽기data # UTF-8 인코딩으로 CSV 파일 읽기 data read.csv() 함수는 기본적으로 첫 번째 행을 변수 이름으로 간주만약 데이터에 변수 이름이 없는 경우, header = FALSE 옵션을 추가하여 변수 이름을 제거할 수 있음데이터의 문자열을 올바르게 처리하기 위해 인코딩을 지정해야 할 수 있음예를 들어, UTF-8로 인코딩된 CSV 파일을 읽는 경우 : encoding = "UTF-8" 옵션 추가불러오기 주요 옵션file: CSV 파일명과 경로 또는 URL을 지정 (필수) header: 논리값으로, CSV 파일의 첫 번째 행을 변수 이름으로 사용할지 여부를 지정, 기본값은 TRUEsep: 필드를 구분하는 .. 2023. 7. 23. 데이터 분석 #2 (DIKW 피라미드) 보석이 만들어지는 과정을 보면, 광산에서 거의 돌 상태의 광물을 채굴한 후, 원석(가공이나 커팅이 되어 있지 않은 상태)을 커팅하여 나석(커팅은 되었으나, 세팅이 되기 전)으로 만들고, 장신구에 맞게 세팅하여 비로서 보석으로 의미와 가치가 생기는 과정을 생각하게 되었다. 데이터를 가공하여 목적에 맞는 정보를 생성하고 다른 지식을 접목함으로써 최적 또는 차선의 의사결정이 가능한 결과를 도출함, 많은 자료들이 이러한 과정을 DIKW 피라미드를 통해서 설명하고 있다. 데이터가 너무 많은 시대에 데이터를 가공하여, 의미있는 정보로 변환하여 Insight 도출하고 의사결정이 하는 것이 현대 직장인의 주요 업무가 아닐까 생각한다. DIKW 피라미드 Data - Information - Knowledge - Wisd.. 2023. 7. 22. 데이터 분석 #1 다년간 '4차 산업혁명', 'DT (Digital Transformation)', 'DX (Digital + X (cross, trans 의미의 X)라는 말이 다년간 유행해 왔다. Covid 19는 'Digital'의 힘을 더욱더 강하게 인식하게 된 계기가 되었다. 4차 혁명과 DX 시대의 핵심은 데이터에 있으며, 데이터를 잘 사용하는 것이 중요한 시대이다. 대부분 기업들은 ERP를 비롯한 정보 시스템을 통해서 데이터 축적은 이미 해오고 있다. 그러나, 이러한 Digital 시대에 "축적된 데이터를 어떻게 사용해야 할지"에 대한 고민은 부족했고, 데이터 분석에 사용하려고 보니, "사용할 가치가 있는 데이터가 부족"한 것이 현실이다. 알파고는 인간보다 바둑을 잘 두기 위해서 수 많은 기보를 학습했고, 인간.. 2023. 7. 22. 데이터 분석 프로그래밍 언어 #2 통계 소프트웨어 비교 #1 설명 SPSS - SPSS는 자료 분석에 통계 기법을 사용하여 의사 결정을 위한 분석 결과를 산출하는 통계 분석 소프트웨어 - 주로 가설 검정, 기술 및 예측 분석을 할 때 사용 - 기본적으로 제공하는 분석이나 검정 외에도 Python 및 R 프로그래밍 언저와 호환 사용이 가능 MS Excel - 엑셀은 다양한 수학점 함수를 지원 - z-분포, t-분포, 카이제곱 분포, F-분포, 회귀분석 등 간단한 통계 계산도 가능 - 다만, 자료가 늘어날수록 연산 속도가 급소도로 저하되어 표본 수가 많은 경우는 통계 분석용으로 활용하기 어려움 Python - 오픈소스 고급 프로그래밍 언어로, 기존의 프로그래밍 언어에 비해 문법이 간결하고 표현 구조가 인간의 사고 체계와 닮아 있어 초보자도 .. 2023. 7. 22. 데이터 분석(과학) 프로그래밍 언어 #1 R은 프로그래밍 언어라기 보다는 분석을 위한 Script (스크립트)이기 때문에 사람이 데이터 분석하는 과정대로 스크립트를 작성하면 원하는 분석 결과를 얻을 수 있어, 상대적으로 배우기 쉽다. 특히, 프로그래밍 및 코딩 경험이 없는 사람들이 컴퓨팅 사고를 배우기에 적합하다. 컴퓨팅 사고 (Computational thinking, CT)는 컴퓨터(또는 사람, 기계)가 효과적으로 업무를 수행할 수 있도록 문제를 정의하고 그에 대한 답을 논리적으로 조직화 및 기술하는 것이 포함된 사고 과정 일체를 일컫는다. https://ko.wikipedia.org/wiki/%EC%BB%B4%ED%93%A8%ED%8C%85_%EC%82%AC%EA%B3%A0 Data Science 분야에서 경력을 쌓는 데 관심이 있다면, .. 2023. 7. 22. Rstudio 다운로드 및 설치 R 언어의 특징 데이터 분석에 특화된 언어 - R은 통계를 포함한 데이터 분석 목적으로 개발된 언어 - R은 다른 프로그래밍 언어와 다르게 컴파일 과정없이 바로 실행하여 결과 확인 가능 - 이러한 이유로 R로 작성한 것을 '프로그램'아 아니라, 'Script (스크립트)'라고 부름 다양한 패키지 - 업무 특성 및 데이터 분석 특성에 맞춘 함수들이 집합된 패키지 제공 - 머신러닝, chatGPT 연계 등 최신 기술을 접목한 패키지 제공 - 패키지는 개발되어 무류로 사용될 수 있도록 공유 (관련 매뉴얼 포함) 활발한 사용자 커뮤니티 - R 사용자들이 github, Rpubs 등을 통해 라이브러리 및 소스 공개 - Google에 관련 검색을 하면, 관련 블로그, 사이트가 많이 있음 (검색어 + 'in R') .. 2023. 7. 22. 이전 1 ··· 14 15 16 17 다음 728x90