본문 바로가기
  • "You can't manage what you can't measure" Peter Drucker
728x90

전체 글234

대한민국 아시안게임 축구 야구 역대 성적 (축구 3연패, 야구 4연패 달성) 아시안게임 축구 역대 경기 결과 (순위) 대한민국 축구 3연속 금메달 달성 (2014 인천, 2018 자카르타/팔램방, 2022 항저우 대회) 아시안게임 사상 첫 3연패 황선홍호, 아시안게임 남자축구 3연패…일본에 2-1 역전승 https://www.yna.co.kr/view/AKR20231007057600007 [1보] 황선홍호, 아시안게임 남자축구 3연패…일본에 2-1 역전승 | 연합뉴스 (항저우=연합뉴스) 안홍석 최송아 기자 = 황선홍호가 일본에 역전승하고 아시안게임 3연패를 이뤄냈다. www.yna.co.kr 연도 개최국가 개최지 금메달 은메달 동메달 4위 비고 1951 인도 뉴델리 인도 이란 일본 아프가니 스탄 6.25전쟁으로 대한민국 불참 1954 필리핀 마닐라 중화민국 대한민국 버마 인도네시.. 2023. 10. 8.
[Rstudio tidyverse] dplyr 패키지 (group_by, summarize, arrange) dplyr 패키지 (group_by, summarize, arrange) group_by 및 summarize : 그룹화된 데이터에서 요약 통계량을 계산 group_by() 및 summarize() 함수는 dplyr 패키지의 중요한 기능 중 하나로, 데이터 프레임을 그룹화하고 각 그룹에 대한 요약 통계량을 계산하는 데 사용된다. summarize() 내 통계량 사용 함수 및 내용 평균 (Mean) mean(x): 열 x의 평균 값을 계산 중앙값 (Median) median(x) : 열 x의 중앙값을 계산 최댓값 (Maximum) max(x) 열 x에서 최댓값을 계산 최솟값 (Minimum) min(x): 열 x에서 최솟값을 계산 범위 (Range) max(x) - min(x): 열 x의 범위를 계산 표준.. 2023. 10. 8.
[Rstudio tidyverse] dplyr 패키지 (filter, select, mutate) dplyr 패키지 (filter, select, mutate) dplyr 패키지는 R에서 데이터 프레임을 다루는 작업을 효율적으로 수행하기 위한 패키지로, 데이터 필터링, 정렬, 그룹화, 요약, 변환 등 다양한 작업을 할 수 있다. 데이터 분석 초기에 많이 사용되며, 데이터를 요약하고 살펴보기 위한 용도와 단계별 분석을 위해서 가공하기 위해서 많이 사용되며, 직관적인 문법을 제공한다. penguins 데이터 세트는 palmerpenguins 패키지에 포함되어 있으며, 펭귄 종류에 대한 정보와 크기, 무게 등의 데이터가 포함되어 있음 install.packages('palmerpenguins') #팔머 펭귄 Dataset이 포함된 패키지 library(palmerpenguins) data("penguins.. 2023. 10. 7.
[R studio] tidyverse 패키지와 특장점 tidyverse 패키지 tidyverse는 R 프로그래밍 언어를 사용하는 데이터 분석 및 시각화 작업을 단순화하고 향상시키기 위한 패키지 모음이다. tidyverse에 포함된 패키지는 데이터를 더 효과적으로 다루고 시각화하며, 코드의 가독성을 높이고 데이터 분석 작업을 더 편리하게 만들어 준다. tidyverse 포함 패키지 tidyverse 패키지를 설치하고 라이브러리로 불러오면, 아래 포함 패키지의 기능을 모두 사용할 수 있다. tidyverse 패키지 설치를 통해서 가장 많이 하는 데이터 분석의 대부분을 할 수 있다. (엑셀로 하는 데이터 분석을 엑셀보다 빠르고 쉽게 할 수 있다.) install.packages('tidyverse') library(tidyverse) > library(tidyv.. 2023. 10. 7.
[R studio] 다른 디렉터리 (디렉토리, 폴더) 파일 불러오기 저장하기 하위 디렉터리는 './'로 이동하고, 상위 디렉터리는 '../'로 이동한다. 디렉터리를 직접 지정할 수도 있다. 하위 디렉터리(폴더) 파일 불러오기 setwd('C:/Rstudio') getwd() > getwd() [1] "C:/Rstudio" slam_dunk str(slam_dunk) 'data.frame': 48 obs. of 8 variables: $ uniform_no: int 4 5 6 7 8 9 10 11 12 13 ... $ name : chr "채치수" "권준호" "이달재" "송태섭" ... $ height : int 197 178 164 168 170 180 189 187 170 171 ... $ weight : int 90 62 NA 59 NA NA 83 75 NA NA ... $ .. 2023. 10. 7.
[R studio] 작업 디렉터리 (디렉토리, 폴더) 확인, 설정 변경 관리 작업 디렉터리 (폴더) 작업 디렉터리 (폴더) : 작업에 사용하고자 (읽거나 쓰고자) 하는 파일이 위치한 디렉터리 (폴더) R에서 어떤 파일을 읽으려면 그 파일이 위치한 디렉터리 (폴더)의 경로와 함께 파일 이름을 지정해야 한다. getwd와 setwd getwd() : 현재 작업 디렉터리 확인 현재 작업 디렉터리의 경로가 출력된다. 작업 디렉터리가 다르게 지정되어 있으면, 필요한 데이터 파일 (엑셀, CSV 파일 등)을 읽어오지 못하거나, 작업한 R 스크립트 파일을 찾기 힘들 수 있다. getwd() > getwd() [1] "C:/Users/vitaminymc/Documents" getwd() setwd() : 작업 디렉터리 설정 / 변경 / 이동 작업 디렉터리를 변경(이동) 하려고 할 때 사용된다... 2023. 10. 7.
KBO 투수 통산 최다 이닝 (SSG 김광현 두산 장원준 통산 2000이닝 달성) Data Source : http://www.statiz.co.kr/ 통산기록실 (1982년~2023년 10월 14일 기준) 통산 기록 팀은 통산 주 소속팀, 앞의 숫자는 시즌 수, “+”는 현역선수, 통산 주 포지션을 의미 (스탯티즈 데이터와 KBO 공식 기록과 차이가 있을 수 있음) 투수 최다 이닝 (1500이닝 이상, 1982년~2023년) 1위 송진우 (3003 이닝) - 2위 정민철 (2394.2 이닝) - 3위 양현종 (2332.1 이닝) 2023 시즌 현역 1위 양현종 (2332.1) - 2위 김광현 (2015.1) - 3위 장원준 (2000) Rank 이름 팀 WAR 출장 이닝 ERA 승 패 세 홀드 1 송진우 21한 69.07 672 3003 3.51 210 153 103 17 2 정민철.. 2023. 10. 5.
KBO 투수 최다 경기 출장 (한화 이글스 정우람 리그 최초 통산 1000경기 출장) Data Source : http://www.statiz.co.kr/ 통산기록실 (1982년~2023년 10월 2일 기준) 통산 기록 팀은 통산 주 소속팀, 앞의 숫자는 시즌 수, “+”는 현역선수, 통산 주 포지션을 의미 (스탯티즈 데이터와 KBO 공식 기록과 차이가 있을 수 있음) 투수 최다 경기 출장 (500경기 이상) 1위 정우람 (1000경기) - 2위 류택현 (901경기) - 3위 조웅천 (813경기) 정우람 선수는 선발 등판없이 구원 등판으로만 1000경기 출장 Rank 이름 팀 출장 승 패 ERA 선발 등판 선발승 구원 등판 구원승 홀드 세이브 1 정우람 18+S 1000 64 47 3.17 0 0 1000 64 145 197 2 류택현 20L 901 15 29 4.41 13 1 888 1.. 2023. 10. 3.
2023 U-18 야구 국가대표 선수 KBO 지명 (+ 최강야구 맞대결) 2023 U-18 야구 국가대표 선수 명단 등번호 이름 현 소속(2023) 포지션 투타 지명팀 지명순위 2023년 성적 1 김택연 인천고 3학년 투수 우투우타 두산 베어스 전체2순위, 두산1R ERA : 1.13, 13경기 7승 1패 11 전미르 경북고 3학년 투수 우투우타 롯데 자이언츠 전체3순위, 롯데1R ERA : 1.32, 18 경 5승 1패 15 황준서 장충고 3학년 투수 좌투좌타 한화 이글스 전체1순위, 한화1R ERA : 2.16, 15경기 6승 2패 16 육선엽 장충고 3학년 투수 우투우타 삼성 라이온즈 전체4순위, 삼성1R ERA : 0.41, 12경기 2승 0패 17 조대현 강릉고 3학년 투수 우투우타 KIA 타이거즈 전체6순위, KIA1R ERA : 1.29, 18경기 7승 0패 18.. 2023. 10. 2.
[R Studio] 비모수 검정과 사후 분석 (논문 작성을 위한 여섯 번째 분석) 비모수 검정 (Nonparametric Test) 모수적 방법 (Parametric method)은 관측값이 어느 특정한 확률분포 (정규분포, 이항분포 등)를 따른다고 전제를 한 후, 그 분포의 모수 (Parameter)에 대한 검정을 실시하는 방법이다. 반면에, 비모수 검정(Nonparametric Test)은 모집단의 분포에 대한 가정이나 정규 분포 가정을 만족하지 않는 데이터에 대한 통계적 가설 검정 방법이다. 비모수 검정은 데이터의 분포에 대한 가정이 덜 필요하거나 없어도 되며, 주로 순위 또는 순서에 의한 비교를 통해 통계적 추론을 수행한다. [비모수 검정 예시 1 : 의학 분야 - 치료 효과 평가] 어떤 신약이 특정 질병의 치료에 효과적인지 비교하려면 환자 그룹 간의 중위수 차이를 비교하는 M.. 2023. 10. 2.
[R Studio] 이원배치 분산분석 ANOVA 2 (상호작용이 있는 경우) 이원배치 분산분석 (two-way ANOVA (Analysis of Variance)) 이원배치 분산분석 예 (상호작용이 있는 경우) 세 종류의 캔디향 (A, B, C)와 세 가지 가격 (79센트, 89센트, 99센트)의 판매효과를 시험하려고 한다. 캔디 매출 수준이 유사한 9개의 점포를 선정하고, 판매량을 조사하였다. 캔디향 A 캔디향 B 캔디향 C 79센트 8 7 10 8 9 9 14 13 15 89센트 4 6 7 14 12 15 12 13 14 99센트 9 10 11 8 7 10 13 14 15 candy candy [1] "apple" "apple" "apple" "apple" "apple" "apple" "apple" "apple" "apple" "grape" "grape" "grape" [13.. 2023. 10. 1.
[R Studio] 이원배치 분산분석 ANOVA (논문 작성을 위한 다섯 번째 분석) 이원배치 분산분석 (two-way ANOVA (Analysis of Variance)) 두 가지 독립 변수 (또는 요인)가 동시에 작용하는 경우(실험)에 대한 분산분석법을 이원배치 분산분석 (two-way ANOVA)라고 한다. 이원배치 분산분석에서는 두 독립 변수(요인) 간의 상호작용 (interaction effect)이 있는지를 먼저 조사(검정)하고, 상호작용이 존재하지 않아야만 각각의 요인의 효과를 따로 떼어서 분석하는 것이 가능해진다. 이원배치 분산분석에서는 두 요인의 각각의 효과 이외에 두 요인 간의 상호작용이 추가될 수 있다. 다중비교 절차 1. 두 요인간의 상호작용이 존재하는지 확인한다. 2. 상호작용이 존재하지 않으면, 요인 효과를 따로 분리하여 각각의 요인에 대하여 다중비교를 실시할 수.. 2023. 10. 1.
KBO 통산 최다 안타, 최다 루타 (손아섭 2400안타 기록) Data Source : http://www.statiz.co.kr/ 통산기록실 (1982년~2023년) + KBO 기록실 손아섭 선수정보 https://www.koreabaseball.com/Record/Player/HitterDetail/Total.aspx?playerId=77532 스탯티즈 데이터의 수시 오류 수정 등으로 조회 시점에 따라 차이가 있을 수 있으며, 스탯티즈 데이터와 KBO 공식 기록과 차이가 있을 수 있음 NC 손아섭 통산 2400 안타 손아섭 통산 2416 안타 기록 (2023년 기준) 9월 27일 기준 통산 1399안타 + 9월 28일 4타수 4안타 = 통산 2403안타 2022년 통산 2229안타 + 2023 시즌 187 안타 = 통산 2416안타 2024 시즌에는 KBO 통산.. 2023. 9. 29.
[R Studio] 평균의 비교 대응 표본 T-검정(test) (논문 작성을 위한 네 번째 분석) t-검정은 두 모집단의 독립여부에 따라, "독립 표본 t-검정"과 "대응 표본 t-검정"으로 나눌 수 있다. 독립 2표본 t-검정은 두 독립적인 집단 간의 평균 차이를 비교하는 데 사용되며, 대응 2표본 t-검정은 동일한 개체 또는 단위에 대한 두 가지 다른 조건 또는 시점에서 수집한 데이터 간의 평균 차이를 비교하는 데 사용된다. 1. 독립 표본 t-검정 예 : 두 그룹의 학생들이 서로 다른 수학 시험의 평균 점수를 비교 이들 그룹은 서로 독립적이며, 두 그룹의 데이터는 서로 관련이 없다. 2. 대응 표본 t- 검정 예 : 어떤 치료 전후에 환자들의 혈압을 측정하여 치료 효과를 비교 치료 전과 후에 대응되는 데이터로 간주되며, 이 경우 대응표본 t-검정을 사용하여 두 조건 간의 차이를 검정 비교하고자 .. 2023. 9. 28.
[R Studio] 평균의 비교 T-검정(test) (논문 작성을 위한 네 번째 분석) t-검정 (t-test) t-검정은 두 개의 집단 간에 평균 차이가 통계적으로 유의미한지를 판단하는 데 사용된다. "두 모집단의 평균간의 차이는 없다"라는 귀무가설과 "두 모집단의 평균간에 차이가 있다"라는 대립가설 중에 하나를 선택하는 통계적 검정방법이다. 모든 통계적 검정방법과 마찬가지로, t-검정은 귀무가설이 옳다는 가정 하에 두 모집단으로부터 추출된 표본들로부터 계산된 검정통계량 근거하여 귀무가설을 부정할 수 있는 상당한 근거를 보이면 귀무가설을 기각하고, 그렇지 않을 경우에는 귀무가설을 받아들이게 된다. t-검정통계량을 계산하여 두 표본평균간의 차이가 귀무가설 하에 있을 확률, 표본오차로 인해 차이가 발생할 확률 (유의확률, p-값)을 계산한다. 만약 계산된 확률이 귀무가설을 기각하기로 설정한 .. 2023. 9. 28.
728x90