본문 바로가기
  • "You can't manage what you can't measure" Peter Drucker
728x90

분류 전체보기251

[R Studio] 평균의 비교 대응 표본 T-검정(test) (논문 작성을 위한 네 번째 분석) t-검정은 두 모집단의 독립여부에 따라, "독립 표본 t-검정"과 "대응 표본 t-검정"으로 나눌 수 있다. 독립 2표본 t-검정은 두 독립적인 집단 간의 평균 차이를 비교하는 데 사용되며, 대응 2표본 t-검정은 동일한 개체 또는 단위에 대한 두 가지 다른 조건 또는 시점에서 수집한 데이터 간의 평균 차이를 비교하는 데 사용된다. 1. 독립 표본 t-검정 예 : 두 그룹의 학생들이 서로 다른 수학 시험의 평균 점수를 비교 이들 그룹은 서로 독립적이며, 두 그룹의 데이터는 서로 관련이 없다. 2. 대응 표본 t- 검정 예 : 어떤 치료 전후에 환자들의 혈압을 측정하여 치료 효과를 비교 치료 전과 후에 대응되는 데이터로 간주되며, 이 경우 대응표본 t-검정을 사용하여 두 조건 간의 차이를 검정 비교하고자 .. 2023. 9. 28.
[R Studio] 평균의 비교 T-검정(test) (논문 작성을 위한 네 번째 분석) t-검정 (t-test) t-검정은 두 개의 집단 간에 평균 차이가 통계적으로 유의미한지를 판단하는 데 사용된다. "두 모집단의 평균간의 차이는 없다"라는 귀무가설과 "두 모집단의 평균간에 차이가 있다"라는 대립가설 중에 하나를 선택하는 통계적 검정방법이다. 모든 통계적 검정방법과 마찬가지로, t-검정은 귀무가설이 옳다는 가정 하에 두 모집단으로부터 추출된 표본들로부터 계산된 검정통계량 근거하여 귀무가설을 부정할 수 있는 상당한 근거를 보이면 귀무가설을 기각하고, 그렇지 않을 경우에는 귀무가설을 받아들이게 된다. t-검정통계량을 계산하여 두 표본평균간의 차이가 귀무가설 하에 있을 확률, 표본오차로 인해 차이가 발생할 확률 (유의확률, p-값)을 계산한다. 만약 계산된 확률이 귀무가설을 기각하기로 설정한 .. 2023. 9. 28.
[R 기초] 기술통계 (논문 작성을 위한 세 번째 분석) 기술통계 주어진 데이터를 몇 개의 요약값으로 효과적으로 표현하는 방법이 기술통계 분석이다. 기술통계 값은 차후에 고차원 데이터 분석을 위한 준비과정이다. 기술통계 값은 (1) 분포의 중심을 나타내는 중심 경향 값, (2) 분포의 퍼짐 정도를 나타내는 산포도, (3) 분포의 모양을 나타내는 분포도로 나뉜다. 구분 분석 값 의미 기술통계 값 중심 경향 값 분포의 중심 평균, 중위수(중앙값), 최빈값 산포도 분포의 퍼짐 정도 표준편차, 분산, 범위, 사분위 범위 분포도 분포의 모양 왜도, 첨도 평균 (R 함수 : mean) 평균은 대표적인 통계 값이나, 극단 값(extreme valuse)의 영향을 받기 때문에 표본의 크기(관측값)가 작을 경우에는 몇 개의 극대값에 의해서 대표값 기능을 상실 할 수도 있다. .. 2023. 9. 26.
물류센터 (창고) 로케이션 location 관리 물류센터 로케이션 체계를 알아보기 전, 아래 방송 내용을 먼저 보자. 아파트 층수 + 호수가 반대인 아파트 (호수 + 층수) 부천에 있는 'ㅂ' 아파트 'ㅂ' 아파트 호수 체계 [ MBC 생방송 오늘 아침] 501호가 1층? 뒤죽박죽 아파트 (2021.06.11 방송) https://www.youtube.com/watch?v=_tknTq2kwqE 이러한 호수 체계로 이 아파트에 처음 오는 택배 기사님이나 배달 기사님들은 헷갈려 한다고 한다. 1983년 입주한 5층 아파트로 당시에는 아파트가 드문 시대라, 당시 건설회사가 이러한 호수체계로 정했다고 함 (아파트 호수에 대한 특별한 규정은 없다고...) 물류센터 로케이션 번호 (주소) 체계 ( Location Numbering System) 물류센터 로케이션.. 2023. 9. 25.
Dome 돔 (지붕 있는) 야구장 (일본 프로야구 NPB) NPB (Nippon Professional Baseball) 일본 야구 NPB에는 2개의 개폐형 돔 구장과 4개의 고정형 돔 구장이 있다. 총 12팀 (Central league 6팀, Pacific league 6팀) 중 6팀이 돔 구장을 홈구장으로 사용하고 있다. Source : https://en.wikipedia.org/wiki/List_of_Nippon_Professional_Baseball_stadiums 대부분 1990년대 건설되었으며, 2023년 훗카이도에 개폐형 돔구장 개장 1988년 도쿄 돔, 1993년에 후쿠오카 돔(개폐형), 1997년 오사카 돔, 나고야 돔, 2001년 삿포로 돔 오픈 삿포로 돔은 2002 한일 월드컵 경기장으로 야구장과 축구장 겸용으로 건설 J리그 축구팀 Hok.. 2023. 9. 23.
Dome 돔 (지붕 있는) 야구장 (미국 MLB) MLB (Major League Baseball) 개폐식 지붕을 갖춘 메이저 리그 야구 경기장은 7개입니다. 로저스 센터는 개폐식 지붕을 갖춘 최대 규모의 야구장으로 총 49,282명을 수용할 수 있습니다. Tampa Bay Rays의 홈구장인 Tropicana Field는 고정된 돔 지붕을 갖춘 유일한 현역 MLB 경기장입니다. 플로리다주 세인트피터즈버그에 위치한 야구장의 지붕은 허리케인으로부터 경기장을 보호하고 내부 용적을 줄여 냉방 비용을 최소화하기 위해 비스듬하게 설계되었습니다. https://sports.betmgm.com/en/blog/mlb/mlb-ballparks-with-retractable-roofs-bm15/ MLB Ballparks With Retractable Roofs How m.. 2023. 9. 23.
KBO 프로야구 (타자) 선수별 통산 기록 #5 - 타점 (양의지 1000타점) 양의지 1000타점 (KBO 23번째) 2023년 9월 22일 두산 vs. 삼성 (대구) 두산 선수 3번재 (김동주, 홍성흔, 양의지) 김현수 선수는 LG 소속으로 1000타점 달성 (2020년 7월 8일 LG vs. 두산 전) 포수 3번째 (홍성흔, 강민호, 양의지) KBO 통산 타점 Top 30 (1982년~2023년) Rank 이름 팀 G 타점 득점 안타 홈런 루타 타율 장타 도루 1 최형우 18+삼LF 2065 1542 1224 2323 373 3966 0.312 0.532 28 2 이승엽 15삼1B 1906 1498 1355 2156 467 4077 0.302 0.572 57 3 최정 19+S3B 2164 1454 1368 2133 458 3919 0.287 0.528 173 4 이대호 17롯1.. 2023. 9. 23.
[R 기초] 결측값 결측치 처리 (데이터 클린징) 데이터 전처리 (Data Preprocessing) 데이터 전처리는 데이터 사이언스, 머신 러닝 및 데이터 분석 프로젝트 필요한 데이터를 준비하고 가공하여 분석, 모델링 또는 머신 러닝 모델에 적합하게 사용할 수 있는 형태로 준비하는 포괄적인 과정 데이터의 품질을 향상시키고 분석 가능한 형태로 변환하여 모델의 성능을 최적화하고 정확성을 확보하기 위한 사전 단계 데이처 전처리 과정 1. 데이터 수집 : 프로젝트의 목적에 따라 적합한 데이터를 수집하고 데이터의 정확성과 완전성을 확인 시스템에서 데이터를 추출하더라도 엑셀 파일 등으로 변환하는 과정에서 누락이나 중복되는 경우 발생 데이터에 사용되는 여러 날짜 (예. 주문일, 물류센터 출고일, 고객 배송일 등)와 분석 대상 기간의 기준 확인 필요 2. 결측치 처.. 2023. 9. 21.
[R 기초] 교차 분석 (논문 작성을 위한 두 번째 분석) 교차분석 수집한 설문 결과에 대해서 단일 변수에 대한 빈도분석을 수행한 후, 의미있는 정보를 얻기 위해서는 두 가지 이상의 변수를 결합하여 분석한다. R / Rstudio addmargins + table addmargins() 함수는 행렬 또는 데이터 프레임에 마진(margin)을 추가하는 데 사용되는 함수 마진은 행과 열의 합계 또는 평균, 최대값, 최소값, 중앙값 등을 계산하여 제공 addmargins(table (penguins$species, penguins$island) ) #옵션을 지정하지 않으면, 행과 열의 합계를 출력 Biscoe Dream Torgersen Sum Adelie 44 56 52 152 Chinstrap 0 68 0 68 Gentoo 124 0 0 124 Sum 168 12.. 2023. 9. 18.
[R 기초] 빈도 분석 (논문 작성을 위한 첫 번째 분석) 빈도 분석 전공에 따라 논문 작성 방식 및 취급 데이터 특성의 차이가 있으나, 범주형 변수를 분석하는 첫 번째 단계는 각 변수의 변수값의 빈도와 비율을 계산하는 것이다. 특히, 설문조사를 하는 경우에는 설문 항목별 응답 결과에 대한 빈도 분석을 첫 번째로 한다. 설문지 예시 1. 성별 (1) 남성 (2) 여성 2. 연령대 (1) 18~29 (2) 30대 (3) 40대 (4) 50대 (5) 60대 (7) 70대 이상 3. 프로야구 관심 정도 (1) 많이 있다 (2) 약간 있다 (3)별로 없다 (4) 전혀 없다 (5)모름/응답거절 4. 가장 좋아하는 KBO 프로야구 팀 (1) KIA 타이거즈 (2) 삼성 라이온즈 (3) 롯데 자이언츠 (4) 한화 이글스 (5) 두산 베어스 (6) LG 트윈스 (7) SSG .. 2023. 9. 18.
물류센터 기능 (입고 Receiving ~ 출고 Shipping) 물류센터 기능 Source : World-Class Warehouse and Material Handling 물류센터는 제품/상품을 효율적으로 저장하고 처리하는 중요한 역할을 한다. 비즈니스 특성에 따라 차이가 있으나, 상기 그림처럼 물류센터의 기능을 구분할 수 있다. Receiving (입고) 공장, 협력사(Vendor), 타 물류센터로부터 화물(제품, 상품)을 가져오면, 품목 및 수량, 상태를 확인 입고 수량을 시스템에 입력하여 입고 확정 입고예정정보(ASN : Advanced Shipping Notice)를 먼저 수신하면, 입고예정정보와 실물과 비교를 통해서 빠르게 검수하고 입고 확정할 수 있음 입고예정정보는 일고일자, 입고품목, 입고수량 정보로 구성되며, 구매 오더(P/O), 이동 오더(STO)를.. 2023. 9. 17.
KBO 사이클링 히트 (역대 31호 32호) [ KBO 32호 사이클링 히트 : 롯데 자이언츠 고승민 ▩ ]2024년 9월 17일 LG : 롯데전에서 롯데 고승민 선수가 사이클링 히트를 달성시즌 2호, 역대 32번째, 구단 4번째1회 단타 - 3회 3루타 - 5회 단타 - 7회 홈런 - 8회 2루타 5타수 5안타 3타점, 4득점KBO 역대 32호, 롯데 자이언츠 4호 (정구선 87.8.31, 김응국 96.4.14, 오윤석 20.10.4, 고승민 24.9.17)[ KBO 31호 사이클링 히트 : KIA 타이거즈 김도영 ▩ ]2024년 7월 23일 NC : KIA전에서 KIA 김도영 선수가 사이클링 히트를 달성1회 단타 - 3회 2루타 - 5회 3루타 - 6회 홈런 (2점)단타-2루타-3루타-홈런  순으로 사이클링 히트 완성 (KBO 2번째 내추럴 사.. 2023. 9. 16.
KBO 프로야구 (타자) 통산 기록 : 최다 2루타_최다 3루타 Data Source : http://www.statiz.co.kr/ 통산기록실 (1982년~2023년) 스탯티즈 데이터의 수시 오류 수정 등으로 조회 시점에 따라 차이가 있을 수 있으며, 스탯티즈 데이터와 KBO 공식 기록과 차이가 있을 수 있음 통산 기록 팀은 통산 주 소속팀, 앞의 숫자는 시즌 수, “+”는 현역선수, 통산 주 포지션을 의미 예시 : 1+K2B, 1+KDH, 10삼CF, 11KRF, 10키1B 통산 최다 2루타 (Top 20 + 이대호, 박병호) 1위 최형우, 2위 이승엽, 3위 양준혁 Rank 이름 팀 안타 2루타 3루타 홈런 타율 장타 OPS 도루 Rate (%) 1 최형우 18+삼LF 2323 490 17 373 0.312 0.532 0.934 28 21.1 2 이승엽 15삼1.. 2023. 9. 15.
[R 기초] 변수 및 자료 유형 (벡터 및 주요함수) 변수란 변수(Variable)는 데이터를 저장하고 관리하기 위한 기본 요소입니다. 변수는 데이터를 저장하는 데 사용되며, 변수에는 다양한 유형의 데이터를 저장할 수 있습니다 변수는 해당(저장 된) 데이터에 접근하거나 조작할 때 사용됩니다. R에서는 변수는 숫자, 문자열, 논리 값 등 다양한 데이터 유형을 저장하는 데 사용됩니다. 예) name, birth date, age, job, address 등 컬럼 (Columns) : 컬럼은 주로 데이터베이스 또는 표 형식의 데이터 구조에서 사용되는 용어입니다. 변수와 컬럼은 데이터의 저장 및 조작을 위한 관련된 개념이지만, 사용되는 문맥에 따라 약간의 차이가 있을 수 있습니다. 표나 데이터베이스의 열은 데이터의 특정 유형(숫자, 문자열 등)을 나타내며, 열은 .. 2023. 9. 10.
최강야구 선수단 #3 (야수, KBO 성적) 최강야구 선수단 (야수) 구분 배번 이름 JTBC 소개 문구 비고 외야수 33 박용택 KBO 통산 역대 최다 2236경기, 최다 2504안타 기록이 증명하는 야구 레전드 외야수 29 이택근 올림픽, 아시안 게임, WBC 금-은-동 메달 섭렵 꾸준한 타격감과 투지 넘치는 플레이의 강타자 2006 아시안 게임 동메달 2008 올림픽 금메달 2009 WBC 준우승 외야수 37 정의윤 뜨거운 타격감과 시원한 장타력을 갖춘 믿고 보는 거포형 외야수 외야수 24 김문호 좌-중-우 총망라하는 타격 밸런스 갖춘 스프레이 히터 내야수 16 정성훈 KBO 리그 우타자 최초 2000경기 출장, 2000안타 정교한 타격 기술과 파워풀한 장타력을 갖춘 배트컨트롤의 귀재 내야수 10 이대호 KBO 최초 타격 7관왕, 트리플 크라.. 2023. 9. 10.
728x90