본문 바로가기
  • "You can't manage what you can't measure" Peter Drucker
데이터 분석 (with Rstudio)

데이터 분석 #1

by Vitaminymc 2023. 7. 22.
반응형

다년간 '4차 산업혁명', 'DT (Digital Transformation)', 'DX (Digital + X (cross, trans 의미의 X)라는 말이 다년간 유행해 왔다. Covid 19는 'Digital'의 힘을 더욱더 강하게 인식하게 된 계기가 되었다. 

4차 혁명과 DX 시대의 핵심은 데이터에 있으며, 데이터를 잘 사용하는 것이 중요한 시대이다. 

 

대부분 기업들은 ERP를 비롯한 정보 시스템을 통해서 데이터 축적은 이미 해오고 있다.

그러나, 이러한 Digital 시대에 "축적된 데이터를 어떻게 사용해야 할지"에 대한 고민은 부족했고,

데이터 분석에 사용하려고 보니, "사용할 가치가 있는 데이터가 부족"한 것이 현실이다. 

 

알파고는 인간보다 바둑을 잘 두기 위해서 수 많은 기보를 학습했고,

인간보다 빠르게 생각(경우의 수와 승리 확률 시뮬레이션)하여 승리한다.

컴퓨터, AI 및 Machine Learning 기술은 고도화 되었으나,

분야별로, 기업별로 학습시킬 충분한 데이터가 있는지 생각할 필요가 있다.

이러한 데이터를 축적하는 데 있어,

인간이 사용 목적을 먼저 생각해야, 효과적인 축적과 사용이 가능하다.

데이터 분석 및 데이터 리터러시(Literacy)는 지금 시대에 가장 중요한 기본 역량이다.

컴퓨터 공학 전공자와 데이터 엔지니어는 축적 및 사용 기술을 고민하는 전문가이지, 비즈니스 전문가는 아니다. 

데이터 분석 및 관련 직무

요리 = 데이터 분석

(출처 : 데이터 천재들은 어떻게 기획하고 분석할까, 저자 조성준 외 5명 (조성준 : 서울대 산업공학과 교수)

외식을 하기 위해 식당에 있다고 가정해보자. 혹시 식당에서 밀가루와 쇠고기를 얼마나 구입해 어디에 보관하는지, 식자재를 어떤 방법으로 보관하고 어느 정도 시간이 지나면 폐기해야 하는지에 대해 고민하는가? 레스토랑의 주방 스토브 가운데 하나가 고장이 났다면 언제 수리 기사가 오는지, 누가 그를 맞이할 것인지 고민하는가?
우리는 각자 자신이 필요한 것, 원하는 것이 무엇인지만 생각하면 된다. 외식의 경우 손님은 자신을 만족시켜줄 수 있는 요리만 생각하면 된다. 나머지 고민은 요리사와 식당 주인이 해결해야 할 문제다. 식당에 준비된 재료는 셰프의 손길이 닿으면 요리로 바뀌고, 요리는 손님이 먹으면 그의 만족과 포만감으로 바뀐다. 이때 식재료는 빅데이터, 셰프는 분석가, 요리는 인사이트, ‘먹는다’는 행위는 비즈니스 액션, 만족은 비즈니스 가치로 치환할 수 있다. 곧 데이터는 가치(Value)를 만드는 인사이트의 재료가 되는 것이다.

출처 : "데이터 천재들은 어떻게 기획하고 분석할까" 내용 중

 

300x250

 

재료가 같아도 장인의 초밥이 맛있는 까닭

데이터 분석에는 초밥 장인과 같은 마음가짐이 필요하다. 맛있는 초밥을 만들려면 세 가지가 필요하다. 
첫 번째는 훌륭한 재료를 준비하는 일이고, 두 번째는 그 재료의 감칠맛을 살릴 칼솜씨를 갖추는 일이다.
아무리 훌륭한 재료라도 적절한 각도로 잘라내는 기술이 없으면 감칠맛이 나지 않는다고 한다.
마지막 세 번째는 눈앞의 손님이 바라는 맛이나 요리를 제공하는 것이다.
필자가 사는 미국에는 재료가 좋은 초밥집은 있어도 재료의 감칠맛을 살리는 칼솜씨를 갖춘 장인이나

일본인의 기호에 맞는 맛을 제공하는 장인은 많지 않다. 
데이터 분석에 대해서도 똑같은 이야기를 할 수 있다.
정보통신 혁명에 의해 많은 사람이 비교적 쉽게 좋은 데이터(재료)를 손에 넣게 되었다. 정말 멋진 일이다.
하지만 데이터를 어떤 각도로 자를지를 결정하는 감가이나 사고법을 익히지 않으면 애써 구한 재료를 살릴 수가 없게 된다.
또 아무리 멋지게 데이터를 분석했더라도 이런 질문에 답을 주지 못한다면 잔뜩 모은 데이터는 보기에는 좋아도 아무 쓸모 없는, 그야말로 빚 좋은 개살구가 되어버린다.

데이터 자체에 문제가 있다면 모든 게 무용지물


데이터를 분석하는 과정은 초밥 장인이 초밥을 만드는 과정과 비슷하다. 말하자면 확보한 신선한 재료를 조리해서 손님에게 내어놓는 작업이다.  그러므로 아무리 초밥 장인의 솜씨가 좋아도 재료 자체가 썩었다면 도저히 초밥을 먹을 수가 없다. 
물론 문제가 있는 부위만 도려낸다거나 조금 오래된 재료를 써도 괜찮은 요리를 만들 수는 있다. 하지만 요리를 제대로 만들어내기는 매우 어렵다.
데이터 분석도 마찬가지다. 데이터 자체에 문제가 있으면 아무리 뛰어난 분석 기법을 써도 신뢰성 있는 결과를 내기 어렵다.

출처 : 데이터 분석의 힘, 그 많은 숫자들은 어떻게 전략이 되는가 (지은이 : 이토 고이치로, 옮긴이 : 전선영)  
이토 고이치로 (Koichiro Ito)
교토대학교 경제학부 졸업, 미국 캘리포니아대학교 박사과정 수료,
스탠퍼드대학교 경제정책연구소 연구원, 보스턴 대학교 비즈니스 스쿨 조교수를 거쳐
2015년부터 시카고대학교 해리스 스쿨(공동정책대학원)에서 강의 중
전미경제연구소(NBER) 연구원과 경제산업연구소(RIETI) 연구원 겸임
2017년 일반인을 대상으로 처음 집필한 '데이터 분석의 힘'으로 제39회 산토리 학예상과 제60회 닛케이경제도서문화상 수상

데이터 분석은 식당 손님에게 만족과 포만감을 주기 위한, 요리사의 역할로 볼 수 있으며,
훌륭한 요리를 위해서는 요리사의 역량과 좋은 재료가 필요함

 

어머니는 유명한 요리사는 아니지만, 어머니의 요리가 맛있는 이유는 "정성"이 들어간 이유가 아닐까

데이터 분석에 좋은 데이터와 분석자의 역량도 중요하겠지만, 분석자의 의지와 태도가 더 중요할 수도 있음

시티즌 데이터 사이언티스트를 만들어 반전문가를 양상하는 것이다. 
마치 2 ~ 3년 요리학교에 다녀서 전문 셰프가 되자는 것이 아니라, 백화점문화센터에서 하는 5~6주 ‘이탈리안 쿠킹’을 수강하는 것과 같다.
왜 우리는 쿠킹클래스를 수강하는 것일까
첫째, 웬만한 간단한 파스타 요리는 자신이 직접 할 수 있다.
둘째, 이탈리안 음식점의 두꺼운 메뉴의 뒤쪽에 나오는 다양한 파스타를 속속들이 이해하고, 자신이 원하는 파스타, 양념, 조리방식, 치즈 등을 세프에게 주문하여 거의 개인에게 맞춤한 파스터를 먹을 수 있다.
이를 빅데이터 분석에 적용하면 시티즌 데이터 사이언티스는 자신이 직접 간단한 분석을 할 줄 알고, 어려운 분석은 전문가에 맡겨 정확히 원하는 바를 이야기할 수 있게 된다. 무엇을 자신이 직접 하고 전문가에게 맡길지 판별할 수 있는 것이다.


출처 : "데이터 천재들은 어떻게 기획하고 분석할까" 내용 중

모든 사람이 데이터 사이언티스트가 될 필요는 없으나, 현대 직장 생활 또는 개인사업을 하는데 있어서,  데이터 분석을 통해서, 업무 효율을 개선하고 수익을 증대하기 위해서는 어느 정도의 데이터 분석과 해석(이해) 역량은 필수적이며, 이러한 역량을 가진 시티즌 데이터 사이언티스를 양성함 

 

최근 HMR (Home Meal Replacement,)이나 밀키트가 잘 나옴에 따라, 간편하게 요리하여 먹을 수 있게 됨,

어쩌면 데이터 분석을 위한 간편한 Tool (엑셀, R 등)은 이미 준비가 되어 있고, 이러한 Tool을 이용만 하면 됨

같은 라면도 끓이는 사람에 따라, 맛이 다른 것처럼, 

같은 HMR과 밀키트로 요리를 하더라도, 개인의 기호를 반영하여 더 맛있게 먹는 사람처럼,

데이터 분석을 함에 있어도, 상황에 맞게 더 좋은 Insight를 얻을 수 있는 노력이 필요함 

 

1)  HMR : Home Meal Replacement, 가정간편식, 전자레인지에 돌리거나 가볍게 끓여 먹을 수 있는 음식

(출처 : HMR - Daum 백과 )

2)  밀키트 : 식사(meal) 키트(kit)라는 뜻으로 요리에 필요한 손질된 식재료와 딱 맞는 양의 양념, 조리법을 세트로 구성해 제공하는 제품이다. 쿠킹 박스, 레시피 박스라고도 불린다. 이미 조리되어 있어 데우기만 하면 되는 가정간편식(HMR)과 달리, 밀키트는 조리 전 냉장 상태의 식재료를 배송하기 때문에 유통기한이 길지 않으며, 소비자가 동봉된 조리법대로 직접 요리해야 한다. 밀키트는 신선한 재료를 직접 요리해 외식보다 저렴하면서도 건강한 식사를 할 수 있고, 재료를 구입하고 손질하는 시간이 절약돼 1인 가구나 맞벌이 가구로부터 특히 인기를 끌고  

(출처 :  밀키트 - Daum 백과  )

 

더 나은 의사결정을 위한 데이터 접근 방법 

(출처 : 데이터 천재들은 어떻게 기획하고 분석할까, 저자 조성준 외 5명 (조성준 : 서울대 산업공학과 교수)

 

데이터 확보가 곤란한 경우도 많다. 예를 들어, 데이터 수집 자체가 불법이거나 센서 비용이 고가일 때, 수집을 부탁해야 하는 사람이 비협조적인 경우 등 예상치 못한 경우가 생길 위험이 크다. 이런 경우에는 다른 인사이트 또는 다른 가치를 생각해봐야 한다.

출처 : "데이터 천재들은 어떻게 기획하고 분석할까" 내용 중

 

데이터 분석은 Value를 도출하기 위한 가장 기본적인 업무이나, 데이터 분석의 목적을 고민해야 하며, 목적을 달성하기 위해서 어떤 데이터를 분석해야 할지, 해당 데이터가 없다면 대체 데이터는 무엇인지 고민해야 함

오랫동안 업무를 수행했어도, 관리자가 된 후에 고민해야 할 사항은 주니어 시절에 경험한 내용(과거 데이터)과 현재는 다를 수 있다는 것임

 

 

 

728x90