본문 바로가기
  • "You can't manage what you can't measure" Peter Drucker
728x90

전체 글234

[R 기초] 기술통계 (논문 작성을 위한 세 번째 분석) 기술통계 주어진 데이터를 몇 개의 요약값으로 효과적으로 표현하는 방법이 기술통계 분석이다. 기술통계 값은 차후에 고차원 데이터 분석을 위한 준비과정이다. 기술통계 값은 (1) 분포의 중심을 나타내는 중심 경향 값, (2) 분포의 퍼짐 정도를 나타내는 산포도, (3) 분포의 모양을 나타내는 분포도로 나뉜다. 구분 분석 값 의미 기술통계 값 중심 경향 값 분포의 중심 평균, 중위수(중앙값), 최빈값 산포도 분포의 퍼짐 정도 표준편차, 분산, 범위, 사분위 범위 분포도 분포의 모양 왜도, 첨도 평균 (R 함수 : mean) 평균은 대표적인 통계 값이나, 극단 값(extreme valuse)의 영향을 받기 때문에 표본의 크기(관측값)가 작을 경우에는 몇 개의 극대값에 의해서 대표값 기능을 상실 할 수도 있다. .. 2023. 9. 26.
물류센터 (창고) 로케이션 location 관리 물류센터 로케이션 체계를 알아보기 전, 아래 방송 내용을 먼저 보자. 아파트 층수 + 호수가 반대인 아파트 (호수 + 층수) 부천에 있는 'ㅂ' 아파트 'ㅂ' 아파트 호수 체계 [ MBC 생방송 오늘 아침] 501호가 1층? 뒤죽박죽 아파트 (2021.06.11 방송) https://www.youtube.com/watch?v=_tknTq2kwqE 이러한 호수 체계로 이 아파트에 처음 오는 택배 기사님이나 배달 기사님들은 헷갈려 한다고 한다. 1983년 입주한 5층 아파트로 당시에는 아파트가 드문 시대라, 당시 건설회사가 이러한 호수체계로 정했다고 함 (아파트 호수에 대한 특별한 규정은 없다고...) 물류센터 로케이션 번호 (주소) 체계 ( Location Numbering System) 물류센터 로케이션.. 2023. 9. 25.
Dome 돔 (지붕 있는) 야구장 (일본 프로야구 NPB) NPB (Nippon Professional Baseball) 일본 야구 NPB에는 2개의 개폐형 돔 구장과 4개의 고정형 돔 구장이 있다. 총 12팀 (Central league 6팀, Pacific league 6팀) 중 6팀이 돔 구장을 홈구장으로 사용하고 있다. Source : https://en.wikipedia.org/wiki/List_of_Nippon_Professional_Baseball_stadiums 대부분 1990년대 건설되었으며, 2023년 훗카이도에 개폐형 돔구장 개장 1988년 도쿄 돔, 1993년에 후쿠오카 돔(개폐형), 1997년 오사카 돔, 나고야 돔, 2001년 삿포로 돔 오픈 삿포로 돔은 2002 한일 월드컵 경기장으로 야구장과 축구장 겸용으로 건설 J리그 축구팀 Hok.. 2023. 9. 23.
Dome 돔 (지붕 있는) 야구장 (미국 MLB) MLB (Major League Baseball) 개폐식 지붕을 갖춘 메이저 리그 야구 경기장은 7개입니다. 로저스 센터는 개폐식 지붕을 갖춘 최대 규모의 야구장으로 총 49,282명을 수용할 수 있습니다. Tampa Bay Rays의 홈구장인 Tropicana Field는 고정된 돔 지붕을 갖춘 유일한 현역 MLB 경기장입니다. 플로리다주 세인트피터즈버그에 위치한 야구장의 지붕은 허리케인으로부터 경기장을 보호하고 내부 용적을 줄여 냉방 비용을 최소화하기 위해 비스듬하게 설계되었습니다. https://sports.betmgm.com/en/blog/mlb/mlb-ballparks-with-retractable-roofs-bm15/ MLB Ballparks With Retractable Roofs How m.. 2023. 9. 23.
KBO 프로야구 (타자) 선수별 통산 기록 #5 - 타점 (양의지 1000타점) 양의지 1000타점 (KBO 23번째) 2023년 9월 22일 두산 vs. 삼성 (대구) 두산 선수 3번재 (김동주, 홍성흔, 양의지) 김현수 선수는 LG 소속으로 1000타점 달성 (2020년 7월 8일 LG vs. 두산 전) 포수 3번째 (홍성흔, 강민호, 양의지) KBO 통산 타점 Top 30 (1982년~2023년) Rank 이름 팀 G 타점 득점 안타 홈런 루타 타율 장타 도루 1 최형우 18+삼LF 2065 1542 1224 2323 373 3966 0.312 0.532 28 2 이승엽 15삼1B 1906 1498 1355 2156 467 4077 0.302 0.572 57 3 최정 19+S3B 2164 1454 1368 2133 458 3919 0.287 0.528 173 4 이대호 17롯1.. 2023. 9. 23.
[R 기초] 결측값 결측치 처리 (데이터 클린징) 데이터 전처리 (Data Preprocessing) 데이터 전처리는 데이터 사이언스, 머신 러닝 및 데이터 분석 프로젝트 필요한 데이터를 준비하고 가공하여 분석, 모델링 또는 머신 러닝 모델에 적합하게 사용할 수 있는 형태로 준비하는 포괄적인 과정 데이터의 품질을 향상시키고 분석 가능한 형태로 변환하여 모델의 성능을 최적화하고 정확성을 확보하기 위한 사전 단계 데이처 전처리 과정 1. 데이터 수집 : 프로젝트의 목적에 따라 적합한 데이터를 수집하고 데이터의 정확성과 완전성을 확인 시스템에서 데이터를 추출하더라도 엑셀 파일 등으로 변환하는 과정에서 누락이나 중복되는 경우 발생 데이터에 사용되는 여러 날짜 (예. 주문일, 물류센터 출고일, 고객 배송일 등)와 분석 대상 기간의 기준 확인 필요 2. 결측치 처.. 2023. 9. 21.
[R 기초] 교차 분석 (논문 작성을 위한 두 번째 분석) 교차분석 수집한 설문 결과에 대해서 단일 변수에 대한 빈도분석을 수행한 후, 의미있는 정보를 얻기 위해서는 두 가지 이상의 변수를 결합하여 분석한다. R / Rstudio addmargins + table addmargins() 함수는 행렬 또는 데이터 프레임에 마진(margin)을 추가하는 데 사용되는 함수 마진은 행과 열의 합계 또는 평균, 최대값, 최소값, 중앙값 등을 계산하여 제공 addmargins(table (penguins$species, penguins$island) ) #옵션을 지정하지 않으면, 행과 열의 합계를 출력 Biscoe Dream Torgersen Sum Adelie 44 56 52 152 Chinstrap 0 68 0 68 Gentoo 124 0 0 124 Sum 168 12.. 2023. 9. 18.
[R 기초] 빈도 분석 (논문 작성을 위한 첫 번째 분석) 빈도 분석 전공에 따라 논문 작성 방식 및 취급 데이터 특성의 차이가 있으나, 범주형 변수를 분석하는 첫 번째 단계는 각 변수의 변수값의 빈도와 비율을 계산하는 것이다. 특히, 설문조사를 하는 경우에는 설문 항목별 응답 결과에 대한 빈도 분석을 첫 번째로 한다. 설문지 예시 1. 성별 (1) 남성 (2) 여성 2. 연령대 (1) 18~29 (2) 30대 (3) 40대 (4) 50대 (5) 60대 (7) 70대 이상 3. 프로야구 관심 정도 (1) 많이 있다 (2) 약간 있다 (3)별로 없다 (4) 전혀 없다 (5)모름/응답거절 4. 가장 좋아하는 KBO 프로야구 팀 (1) KIA 타이거즈 (2) 삼성 라이온즈 (3) 롯데 자이언츠 (4) 한화 이글스 (5) 두산 베어스 (6) LG 트윈스 (7) SSG .. 2023. 9. 18.
물류센터 기능 (입고 Receiving ~ 출고 Shipping) 물류센터 기능 Source : World-Class Warehouse and Material Handling 물류센터는 제품/상품을 효율적으로 저장하고 처리하는 중요한 역할을 한다. 비즈니스 특성에 따라 차이가 있으나, 상기 그림처럼 물류센터의 기능을 구분할 수 있다. Receiving (입고) 공장, 협력사(Vendor), 타 물류센터로부터 화물(제품, 상품)을 가져오면, 품목 및 수량, 상태를 확인 입고 수량을 시스템에 입력하여 입고 확정 입고예정정보(ASN : Advanced Shipping Notice)를 먼저 수신하면, 입고예정정보와 실물과 비교를 통해서 빠르게 검수하고 입고 확정할 수 있음 입고예정정보는 일고일자, 입고품목, 입고수량 정보로 구성되며, 구매 오더(P/O), 이동 오더(STO)를.. 2023. 9. 17.
KBO 사이클링 히트 (역대 31호 32호) [ KBO 32호 사이클링 히트 : 롯데 자이언츠 고승민 ▩ ]2024년 9월 17일 LG : 롯데전에서 롯데 고승민 선수가 사이클링 히트를 달성시즌 2호, 역대 32번째, 구단 4번째1회 단타 - 3회 3루타 - 5회 단타 - 7회 홈런 - 8회 2루타 5타수 5안타 3타점, 4득점KBO 역대 32호, 롯데 자이언츠 4호 (정구선 87.8.31, 김응국 96.4.14, 오윤석 20.10.4, 고승민 24.9.17)[ KBO 31호 사이클링 히트 : KIA 타이거즈 김도영 ▩ ]2024년 7월 23일 NC : KIA전에서 KIA 김도영 선수가 사이클링 히트를 달성1회 단타 - 3회 2루타 - 5회 3루타 - 6회 홈런 (2점)단타-2루타-3루타-홈런  순으로 사이클링 히트 완성 (KBO 2번째 내추럴 사.. 2023. 9. 16.
KBO 프로야구 (타자) 통산 기록 : 최다 2루타_최다 3루타 Data Source : http://www.statiz.co.kr/ 통산기록실 (1982년~2023년) 스탯티즈 데이터의 수시 오류 수정 등으로 조회 시점에 따라 차이가 있을 수 있으며, 스탯티즈 데이터와 KBO 공식 기록과 차이가 있을 수 있음 통산 기록 팀은 통산 주 소속팀, 앞의 숫자는 시즌 수, “+”는 현역선수, 통산 주 포지션을 의미 예시 : 1+K2B, 1+KDH, 10삼CF, 11KRF, 10키1B 통산 최다 2루타 (Top 20 + 이대호, 박병호) 1위 최형우, 2위 이승엽, 3위 양준혁 Rank 이름 팀 안타 2루타 3루타 홈런 타율 장타 OPS 도루 Rate (%) 1 최형우 18+삼LF 2323 490 17 373 0.312 0.532 0.934 28 21.1 2 이승엽 15삼1.. 2023. 9. 15.
[R 기초] 변수 및 자료 유형 (벡터 및 주요함수) 변수란 변수(Variable)는 데이터를 저장하고 관리하기 위한 기본 요소입니다. 변수는 데이터를 저장하는 데 사용되며, 변수에는 다양한 유형의 데이터를 저장할 수 있습니다 변수는 해당(저장 된) 데이터에 접근하거나 조작할 때 사용됩니다. R에서는 변수는 숫자, 문자열, 논리 값 등 다양한 데이터 유형을 저장하는 데 사용됩니다. 예) name, birth date, age, job, address 등 컬럼 (Columns) : 컬럼은 주로 데이터베이스 또는 표 형식의 데이터 구조에서 사용되는 용어입니다. 변수와 컬럼은 데이터의 저장 및 조작을 위한 관련된 개념이지만, 사용되는 문맥에 따라 약간의 차이가 있을 수 있습니다. 표나 데이터베이스의 열은 데이터의 특정 유형(숫자, 문자열 등)을 나타내며, 열은 .. 2023. 9. 10.
최강야구 선수단 #3 (야수, KBO 성적) 최강야구 선수단 (야수) 구분 배번 이름 JTBC 소개 문구 비고 외야수 33 박용택 KBO 통산 역대 최다 2236경기, 최다 2504안타 기록이 증명하는 야구 레전드 외야수 29 이택근 올림픽, 아시안 게임, WBC 금-은-동 메달 섭렵 꾸준한 타격감과 투지 넘치는 플레이의 강타자 2006 아시안 게임 동메달 2008 올림픽 금메달 2009 WBC 준우승 외야수 37 정의윤 뜨거운 타격감과 시원한 장타력을 갖춘 믿고 보는 거포형 외야수 외야수 24 김문호 좌-중-우 총망라하는 타격 밸런스 갖춘 스프레이 히터 내야수 16 정성훈 KBO 리그 우타자 최초 2000경기 출장, 2000안타 정교한 타격 기술과 파워풀한 장타력을 갖춘 배트컨트롤의 귀재 내야수 10 이대호 KBO 최초 타격 7관왕, 트리플 크라.. 2023. 9. 10.
최강야구 선수단 #2 (투수, KBO 성적) 최강야구 선수단 투수 구분 배번 이름 JTBC 소개 문구 비고 투수 21 송승준 올림픽 금메달의 주역 3경기 연속 완봉승, 전설 제조기 (a.k.a 송삼봉) a.k.a : also known as 투수 13 장원삼 한국 선수 중 유일한 아시아시리즈 MVP KBO 통산 121승 좌완 레전드 투수 2011 아시아시리즈 -한국 : 삼성 라이온즈 -일본 : 소프트뱅크 호크스 -대만 : 퉁이 라이온스 -호주 : 퍼스 히트 투수 15 오주원 데뷔 첫해 KBO 리그를 휩쓴 신인왕 송곳 같은 제구력을 자랑하는 컨트롤 피쳐 2004년 신인왕 -현대 유니콘스 소속 -시즌 10승 9패 투수 47 유희관 KBO 통산 101승 좌완 투수 느린 공의 편견을 깬 제구 마스터 투수 11 이대은 150km/h의 전매특허 강속구 부활한.. 2023. 9. 9.
최강야구 선수단 #1 (감독, 코치 KBO 성적) 최강야구 선수단 구분 배번 이름 (나이, 생년월일) JTBC 소개 문구 비고 감독 38 김성근 (41년12월13일) 3번의 한국시리즈 우승과 22연승 대기록의 신화 프로 통산 1384승을 이끈 야구의 신 수석 코치 71 이광길 (60년 8월 4일) 이기는 야구를 보여주리다 3번의 한국시리즈 우승을 이끈 명품 코치 트레이닝 코치 72 오세훈 최강 몬스터즈 선수들의 컨디션을 200%까지 끌어올릴 전 국가대표 트레이닝 코치 투수 21 송승준 (80년 6월29일) 올림픽 금메달의 주역 3경기 연속 완봉승, 전설 제조기 (a.k.a 송삼봉) 투수 13 장원삼 (83년 6월 9일) 한국 선수 중 유일한 아시아시리즈 MVP KBO 통산 121승 좌완 레전드 투수 투수 15 오주원 (85년 3월31일) 데뷔 첫해 KB.. 2023. 9. 8.
728x90