본문 바로가기
  • "You can't manage what you can't measure" Peter Drucker
데이터 분석 (with Rstudio)

데이터 분석 프로그래밍 언어 #2

by Vitaminymc 2023. 7. 22.
반응형

통계 소프트웨어 비교 #1

      설명    
SPSS -  SPSS는 자료 분석에 통계 기법을 사용하여 의사 결정을 위한 분석 결과를 산출하는 통계 분석 소프트웨어
주로 가설 검정, 기술 및 예측 분석을 할 때 사용
-  기본적으로 제공하는 분석이나 검정 외에도 Python 및 R 프로그래밍 언저와 호환 사용이 가능
MS Excel -  엑셀은 다양한 수학점 함수를 지원
-  z-분포, t-분포, 카이제곱 분포, F-분포, 회귀분석 등 간단한 통계 계산도 가능
-  다만, 자료가 늘어날수록 연산 속도가 급소도로 저하되어 표본 수가 많은 경우는
   통계 분석용으로 활용하기 어려움 
Python -  오픈소스 고급 프로그래밍 언어로, 기존의 프로그래밍 언어에 비해 문법이 간결하고
   표현 구조가 인간의 사고 체계와 닮아 있어 초보자도 쉽계 배우는 장점
데이터 분석, 기계 학습(머신러닝), 그래픽, 학술 연구 등 여러 분야에서 활용
R -  오픈소스 프로그램으로 통계/데이터 마이닝 및 그래프를 위한 언어
-  주로 연구 및 산업별 응용 프로그램으로 많이 사용되고 있음
-  최근에는 기업들이 많이 사용하기 시작
-  특히 빅데이터 분석 기법으로 주목받고 있으며, 수시로 업데이트 되고 있음

(출처 : 고등학교 '통계와 사회' 교과서)

3

  • [통계청 보도자료 (2022.3.29)] 통계청은 교육부와 협업하여 증거 기반의 문제 해결 역량인 통계/데이터 리터러시를 길러주기 위해 사회교과 융합의 "통계와 사회" 교과서를 개발함
    • 빅데이터의 중요성에 따라, 고등학교 교육 과정에도 통계 수업이 강화되고 있음
    • 중요한 것은 통계 값 계산이 아닌, 해석이 강조되어 교육하고 있음
  • 대학생들의 석박사 논문의 통계 분석을 위해서, 과거에는 SPSS 불법 소프트웨어를 많이 사용하였으나, 현재는 오픈 소스 프로그램인 R의 사용 빈도가 높음

통계 소프트웨어 비교 #2

  개발사 사용분야 장점 단점
Excel Microsoft
(상용)
범용 Menu 클릭 방식의 쉬운 활용
빠른 보고서 작성
대용량 데이터 분석의 한계
타 시스템과의 연계 어려움
R R Core tem
(무료)
범용 개인역량에 따라 확장성 코딩에 따른 사용이 어려움
Python Python Software
Foundation (무료)
범용 개인역량에 따라 확장성 코딩에 따른 사용이 어려움
SPSS IBM (상용)
2009년에 IBM이 인수
범용 정형화된 메뉴 방식으로 사용이 쉬움
직관적 아이콘
정형화되어 있어
유연성이 다소 떨어짐
SAS SAS Institute
(상용)
범용 명령어 구조가 정형화되어 있고
다양한 옵션으로 확장가능성도 제공
프로그램이 큼
MATLAB MathWorks
(상용)
과학 및 공학 쉬운 문법
데이터 시각화 기능
소스 코드가 기업 비밀
Stata Stata Corp
(상용)
경제·경영학 
의학·보건학
데이터관리와 그래픽에서 탁월한 능력
다양한 부가적인 기능
버전별로 호환이 되지 않음

(출처 : https://sejong-kr.libguides.com/c.php?g=945436  세종대학교 학술정보원 통계분석 소프트웨어 가이드)

 

유료 소프트웨어 비용

(2023년 2월 확인 결과로 다를 수 있음)

      비용    
SPSS SPSS 구독 플랜
  -  인가된 사용자당 월별 USD 99 (약 13만원/월)부터 시작
(https://www.ibm.com/kr-ko/products/spss-statistics/pricing)
SAS 기본 850만원
MATLAB 표준 260만원
구독 104만원.년
교육용 50~77만원 (2021년 기준)
Stata 240만원/1인
400만원/2인

 

728x90