본문 바로가기
  • "You can't manage what you can't measure" Peter Drucker
728x90

is.na2

[R 기초] 결측값 결측치 처리 (데이터 클린징) 데이터 전처리 (Data Preprocessing) 데이터 전처리는 데이터 사이언스, 머신 러닝 및 데이터 분석 프로젝트 필요한 데이터를 준비하고 가공하여 분석, 모델링 또는 머신 러닝 모델에 적합하게 사용할 수 있는 형태로 준비하는 포괄적인 과정 데이터의 품질을 향상시키고 분석 가능한 형태로 변환하여 모델의 성능을 최적화하고 정확성을 확보하기 위한 사전 단계 데이처 전처리 과정 1. 데이터 수집 : 프로젝트의 목적에 따라 적합한 데이터를 수집하고 데이터의 정확성과 완전성을 확인 시스템에서 데이터를 추출하더라도 엑셀 파일 등으로 변환하는 과정에서 누락이나 중복되는 경우 발생 데이터에 사용되는 여러 날짜 (예. 주문일, 물류센터 출고일, 고객 배송일 등)와 분석 대상 기간의 기준 확인 필요 2. 결측치 처.. 2023. 9. 21.
Rstudio 데이터 살펴보기 #2 (summary 함수, 결측값 확인 등) 분석 데이터 (상북고_농구부.xlsx) (북산 - 나무위키 (namu.wiki) "5. 연재 당시 라인업" 정리, 학년은 나이로 반영) uniform_no name height weight blood type age position 4 채치수 197 90 A 19 C 5 권준호 178 62 A 19 SF 6 이달재 164 18 PG 7 송태섭 168 59 B 18 PG 8 신오일 170 18 PG 9 정병욱 180 18 SF 10 강백호 189 83 B 17 PF 11 서태웅 187 75 AB 17 SF 12 이호식 170 17 SF 13 이재훈 171 17 SG 14 정대만 184 70 A 19 SG 15 오중식 162 17 PG 데이터 요약해서 보기 library(readxl) #엑셀 파일을 불러오기.. 2023. 7. 28.
728x90