본문 바로가기
  • "You can't manage what you can't measure" Peter Drucker
728x90

분류 전체보기251

항저우 아시안게임 야구 국가대표 병역 특례 (면제, 혜택) 국가대표 선출 기준 당초 만 24세 이하 및 입단 3년 차에서 항저우 아시안게임 1년 연기 (중국 Covid-19 상황 악화로 2022년에서 2023년 연기)로 만 25세 이하 및 입단 4년 차, 29세 이하 와일드카드 3장으로 변경 아시안게임 기간 동안, KBO 리그가 정상적으로 진행됨에 따라, 팀당 최대 3명 선 기존 대회 선출 기준 아시안게임 야구에는 연령 제한이 없으며, 1998년 방콕 대회부터 2018년 자카르타·팔렘방 대회까지는 나이에 관계없이 대표팀을 구성함 항저우 아시안게임 야구 국가대표 명단 포지션 등번호 이름 소속 비고 투수 19 고우석 LG 우투우타, 십자인대 파열 (고2) 면제 16 정우영 LG 우투우타 60 박영현 kt 우투우타 18 원태인 삼성 우투좌타 43 나균안 롯데 우투우타.. 2023. 10. 9.
[Rstudio] 데이터 유형별 그래프 선택 기준 및 R 그래프 함수 데이터 유형과 그래프 (chart, plot) 선택 기준 어떤 유형의 데이터를 표현할 때, 어떤 그래프별가 적합할까에 대한 일반적인 기준은 아래와 같다. 산점도(Scatter plot) : 연속형 변수의 상관관계의 시각화 예) x축에는 온도, y축에는 판매량을 나타내어 두 변수 간의 관계 확인 막대 그래프(Bar plot): 범주형 변수의 빈도수, 카테고리 간 비교 등을 시각화 예) 각 지역의 인구수를 막대 그래프로 표현, 지역 간 인구 분포를 비교 선 그래프(Line plot): 연속형 변수의 추세, 변화를 시각화 예) 시간에 따른 주식 가격의 변동을 선 그래프로 표현, 추세를 파악 히스토그램(Histogram): 연속형 변수의 분포를 시각화 예) 제품 크기를 히스토그램으로 표현, 제품 크기의 분포를 .. 2023. 10. 9.
대한민국 아시안게임 축구 야구 역대 성적 (축구 3연패, 야구 4연패 달성) 아시안게임 축구 역대 경기 결과 (순위) 대한민국 축구 3연속 금메달 달성 (2014 인천, 2018 자카르타/팔램방, 2022 항저우 대회) 아시안게임 사상 첫 3연패 황선홍호, 아시안게임 남자축구 3연패…일본에 2-1 역전승 https://www.yna.co.kr/view/AKR20231007057600007 [1보] 황선홍호, 아시안게임 남자축구 3연패…일본에 2-1 역전승 | 연합뉴스 (항저우=연합뉴스) 안홍석 최송아 기자 = 황선홍호가 일본에 역전승하고 아시안게임 3연패를 이뤄냈다. www.yna.co.kr 연도 개최국가 개최지 금메달 은메달 동메달 4위 비고 1951 인도 뉴델리 인도 이란 일본 아프가니 스탄 6.25전쟁으로 대한민국 불참 1954 필리핀 마닐라 중화민국 대한민국 버마 인도네시.. 2023. 10. 8.
[Rstudio tidyverse] dplyr 패키지 (group_by, summarize, arrange) dplyr 패키지 (group_by, summarize, arrange) group_by 및 summarize : 그룹화된 데이터에서 요약 통계량을 계산 group_by() 및 summarize() 함수는 dplyr 패키지의 중요한 기능 중 하나로, 데이터 프레임을 그룹화하고 각 그룹에 대한 요약 통계량을 계산하는 데 사용된다. summarize() 내 통계량 사용 함수 및 내용 평균 (Mean) mean(x): 열 x의 평균 값을 계산 중앙값 (Median) median(x) : 열 x의 중앙값을 계산 최댓값 (Maximum) max(x) 열 x에서 최댓값을 계산 최솟값 (Minimum) min(x): 열 x에서 최솟값을 계산 범위 (Range) max(x) - min(x): 열 x의 범위를 계산 표준.. 2023. 10. 8.
[Rstudio tidyverse] dplyr 패키지 (filter, select, mutate) dplyr 패키지 (filter, select, mutate) dplyr 패키지는 R에서 데이터 프레임을 다루는 작업을 효율적으로 수행하기 위한 패키지로, 데이터 필터링, 정렬, 그룹화, 요약, 변환 등 다양한 작업을 할 수 있다. 데이터 분석 초기에 많이 사용되며, 데이터를 요약하고 살펴보기 위한 용도와 단계별 분석을 위해서 가공하기 위해서 많이 사용되며, 직관적인 문법을 제공한다. penguins 데이터 세트는 palmerpenguins 패키지에 포함되어 있으며, 펭귄 종류에 대한 정보와 크기, 무게 등의 데이터가 포함되어 있음 install.packages('palmerpenguins') #팔머 펭귄 Dataset이 포함된 패키지 library(palmerpenguins) data("penguins.. 2023. 10. 7.
[R studio] tidyverse 패키지와 특장점 tidyverse 패키지 tidyverse는 R 프로그래밍 언어를 사용하는 데이터 분석 및 시각화 작업을 단순화하고 향상시키기 위한 패키지 모음이다. tidyverse에 포함된 패키지는 데이터를 더 효과적으로 다루고 시각화하며, 코드의 가독성을 높이고 데이터 분석 작업을 더 편리하게 만들어 준다. tidyverse 포함 패키지 tidyverse 패키지를 설치하고 라이브러리로 불러오면, 아래 포함 패키지의 기능을 모두 사용할 수 있다. tidyverse 패키지 설치를 통해서 가장 많이 하는 데이터 분석의 대부분을 할 수 있다. (엑셀로 하는 데이터 분석을 엑셀보다 빠르고 쉽게 할 수 있다.) install.packages('tidyverse') library(tidyverse) > library(tidyv.. 2023. 10. 7.
[R studio] 다른 디렉터리 (디렉토리, 폴더) 파일 불러오기 저장하기 하위 디렉터리는 './'로 이동하고, 상위 디렉터리는 '../'로 이동한다. 디렉터리를 직접 지정할 수도 있다. 하위 디렉터리(폴더) 파일 불러오기 setwd('C:/Rstudio') getwd() > getwd() [1] "C:/Rstudio" slam_dunk str(slam_dunk) 'data.frame': 48 obs. of 8 variables: $ uniform_no: int 4 5 6 7 8 9 10 11 12 13 ... $ name : chr "채치수" "권준호" "이달재" "송태섭" ... $ height : int 197 178 164 168 170 180 189 187 170 171 ... $ weight : int 90 62 NA 59 NA NA 83 75 NA NA ... $ .. 2023. 10. 7.
[R studio] 작업 디렉터리 (디렉토리, 폴더) 확인, 설정 변경 관리 작업 디렉터리 (폴더) 작업 디렉터리 (폴더) : 작업에 사용하고자 (읽거나 쓰고자) 하는 파일이 위치한 디렉터리 (폴더) R에서 어떤 파일을 읽으려면 그 파일이 위치한 디렉터리 (폴더)의 경로와 함께 파일 이름을 지정해야 한다. getwd와 setwd getwd() : 현재 작업 디렉터리 확인 현재 작업 디렉터리의 경로가 출력된다. 작업 디렉터리가 다르게 지정되어 있으면, 필요한 데이터 파일 (엑셀, CSV 파일 등)을 읽어오지 못하거나, 작업한 R 스크립트 파일을 찾기 힘들 수 있다. getwd() > getwd() [1] "C:/Users/vitaminymc/Documents" getwd() setwd() : 작업 디렉터리 설정 / 변경 / 이동 작업 디렉터리를 변경(이동) 하려고 할 때 사용된다... 2023. 10. 7.
KBO 투수 통산 최다 이닝 (SSG 김광현 두산 장원준 통산 2000이닝 달성) Data Source : http://www.statiz.co.kr/ 통산기록실 (1982년~2023년 10월 14일 기준) 통산 기록 팀은 통산 주 소속팀, 앞의 숫자는 시즌 수, “+”는 현역선수, 통산 주 포지션을 의미 (스탯티즈 데이터와 KBO 공식 기록과 차이가 있을 수 있음) 투수 최다 이닝 (1500이닝 이상, 1982년~2023년) 1위 송진우 (3003 이닝) - 2위 정민철 (2394.2 이닝) - 3위 양현종 (2332.1 이닝) 2023 시즌 현역 1위 양현종 (2332.1) - 2위 김광현 (2015.1) - 3위 장원준 (2000) Rank 이름 팀 WAR 출장 이닝 ERA 승 패 세 홀드 1 송진우 21한 69.07 672 3003 3.51 210 153 103 17 2 정민철.. 2023. 10. 5.
KBO 투수 최다 경기 출장 (한화 이글스 정우람 리그 최초 통산 1000경기 출장) Data Source : http://www.statiz.co.kr/ 통산기록실 (1982년~2023년 10월 2일 기준) 통산 기록 팀은 통산 주 소속팀, 앞의 숫자는 시즌 수, “+”는 현역선수, 통산 주 포지션을 의미 (스탯티즈 데이터와 KBO 공식 기록과 차이가 있을 수 있음) 투수 최다 경기 출장 (500경기 이상) 1위 정우람 (1000경기) - 2위 류택현 (901경기) - 3위 조웅천 (813경기) 정우람 선수는 선발 등판없이 구원 등판으로만 1000경기 출장 Rank 이름 팀 출장 승 패 ERA 선발 등판 선발승 구원 등판 구원승 홀드 세이브 1 정우람 18+S 1000 64 47 3.17 0 0 1000 64 145 197 2 류택현 20L 901 15 29 4.41 13 1 888 1.. 2023. 10. 3.
2023 U-18 야구 국가대표 선수 KBO 지명 (+ 최강야구 맞대결) 2023 U-18 야구 국가대표 선수 명단 등번호 이름 현 소속(2023) 포지션 투타 지명팀 지명순위 2023년 성적 1 김택연 인천고 3학년 투수 우투우타 두산 베어스 전체2순위, 두산1R ERA : 1.13, 13경기 7승 1패 11 전미르 경북고 3학년 투수 우투우타 롯데 자이언츠 전체3순위, 롯데1R ERA : 1.32, 18 경 5승 1패 15 황준서 장충고 3학년 투수 좌투좌타 한화 이글스 전체1순위, 한화1R ERA : 2.16, 15경기 6승 2패 16 육선엽 장충고 3학년 투수 우투우타 삼성 라이온즈 전체4순위, 삼성1R ERA : 0.41, 12경기 2승 0패 17 조대현 강릉고 3학년 투수 우투우타 KIA 타이거즈 전체6순위, KIA1R ERA : 1.29, 18경기 7승 0패 18.. 2023. 10. 2.
[R Studio] 비모수 검정과 사후 분석 (논문 작성을 위한 여섯 번째 분석) 비모수 검정 (Nonparametric Test) 모수적 방법 (Parametric method)은 관측값이 어느 특정한 확률분포 (정규분포, 이항분포 등)를 따른다고 전제를 한 후, 그 분포의 모수 (Parameter)에 대한 검정을 실시하는 방법이다. 반면에, 비모수 검정(Nonparametric Test)은 모집단의 분포에 대한 가정이나 정규 분포 가정을 만족하지 않는 데이터에 대한 통계적 가설 검정 방법이다. 비모수 검정은 데이터의 분포에 대한 가정이 덜 필요하거나 없어도 되며, 주로 순위 또는 순서에 의한 비교를 통해 통계적 추론을 수행한다. [비모수 검정 예시 1 : 의학 분야 - 치료 효과 평가] 어떤 신약이 특정 질병의 치료에 효과적인지 비교하려면 환자 그룹 간의 중위수 차이를 비교하는 M.. 2023. 10. 2.
[R Studio] 이원배치 분산분석 ANOVA 2 (상호작용이 있는 경우) 이원배치 분산분석 (two-way ANOVA (Analysis of Variance)) 이원배치 분산분석 예 (상호작용이 있는 경우) 세 종류의 캔디향 (A, B, C)와 세 가지 가격 (79센트, 89센트, 99센트)의 판매효과를 시험하려고 한다. 캔디 매출 수준이 유사한 9개의 점포를 선정하고, 판매량을 조사하였다. 캔디향 A 캔디향 B 캔디향 C 79센트 8 7 10 8 9 9 14 13 15 89센트 4 6 7 14 12 15 12 13 14 99센트 9 10 11 8 7 10 13 14 15 candy candy [1] "apple" "apple" "apple" "apple" "apple" "apple" "apple" "apple" "apple" "grape" "grape" "grape" [13.. 2023. 10. 1.
[R Studio] 이원배치 분산분석 ANOVA (논문 작성을 위한 다섯 번째 분석) 이원배치 분산분석 (two-way ANOVA (Analysis of Variance)) 두 가지 독립 변수 (또는 요인)가 동시에 작용하는 경우(실험)에 대한 분산분석법을 이원배치 분산분석 (two-way ANOVA)라고 한다. 이원배치 분산분석에서는 두 독립 변수(요인) 간의 상호작용 (interaction effect)이 있는지를 먼저 조사(검정)하고, 상호작용이 존재하지 않아야만 각각의 요인의 효과를 따로 떼어서 분석하는 것이 가능해진다. 이원배치 분산분석에서는 두 요인의 각각의 효과 이외에 두 요인 간의 상호작용이 추가될 수 있다. 다중비교 절차 1. 두 요인간의 상호작용이 존재하는지 확인한다. 2. 상호작용이 존재하지 않으면, 요인 효과를 따로 분리하여 각각의 요인에 대하여 다중비교를 실시할 수.. 2023. 10. 1.
KBO 통산 최다 안타, 최다 루타 (손아섭 2400안타 기록) Data Source : http://www.statiz.co.kr/ 통산기록실 (1982년~2023년) + KBO 기록실 손아섭 선수정보 https://www.koreabaseball.com/Record/Player/HitterDetail/Total.aspx?playerId=77532 스탯티즈 데이터의 수시 오류 수정 등으로 조회 시점에 따라 차이가 있을 수 있으며, 스탯티즈 데이터와 KBO 공식 기록과 차이가 있을 수 있음 NC 손아섭 통산 2400 안타 손아섭 통산 2416 안타 기록 (2023년 기준) 9월 27일 기준 통산 1399안타 + 9월 28일 4타수 4안타 = 통산 2403안타 2022년 통산 2229안타 + 2023 시즌 187 안타 = 통산 2416안타 2024 시즌에는 KBO 통산.. 2023. 9. 29.
728x90