보고서 :
[다중 회귀 분석]
다음 사항을 적용하여 다중회귀분석을 실시하시오. R의 내장 데이터셋인 state data sets 내 stat.x77 데이터셋 사용
문제 1-1) state 데이터셋을 load하고, state.x77 dataset을 데이터프레임으로 변환하고, Life Exp 변수를 Life.Exp로 HS Grad변수를 HS.Grad로 변경하시오.
문제 1-2) Life Expectancy 변수를 종속변수로 설정하고 나머지 변수를 독립변수로 설정하여 회귀분석을 실시하시오. 실시 후 결과에 대해 해석하시오.
문제 1-3) 문제 1-2)의 회귀모형에서 Income, Illiteracy, Area 변수를 제외하고 회귀분석을 실시하고 결과에 대해 해석하시오.
문제 1-4) Life Expectancy 변수를 종속변수로 설정하고 HS.Grad와 Murder 변수를 예측변수(predictor variable)로 설정하여 회귀분석을 실시하시오.
문제 1-5) 전 인구의 55%가 고졸이고 살인비율이 10만명당 8명일 때 Life Expectancy 결과값을 예측하시오.
문제 1-6) 문제 1-4)에서 처럼 2개의 독립변수, 1개의 종속변수의 데이터와 fit된 회귀평면(fitted regression plane)을 3D 그래프로 시각화하시오.
[시계열 분석]
아래 site에서 제공된 데이터셋은 Johns’ Hopkis 대학 내 The Center For Systems Science and Engineering(CSSE) 에서 업데이트 하는 전세계 코로나(COVID-19) 발생 현황 데이터셋이다. 제공된 데이터셋 중 2021년 8월~2022년 7월 일간
데이터에서 R code로 다음을 수행하고 결과를 팀 별로 리포트 하시오.
문제 2-1) 추세선 확인
문제 2-2) 4가지 변동요인 분해
문제 2-3) 시각화
문제 2-4) 결과 해석
[로지스틱 회귀 분석]
mtcars 데이터에서 엔진(vs)을 종속변수로, 연비(mpg)와 변속기종류(am)를 독립변수로 설정하여 로지스틱 회귀분석을
실시하시오.
문제 3-1) 데이터 가져오기
문제 3-2) 로지스틱 회귀분석 실행하고 회귀모델 확인
문제 3-3) 로지스틱 회귀모델 요약정보 확인
문제 3-4) 로지스틱 회귀식
문제 3-5) 결과 해석
[XGBOOST, 로지스틱 회귀 분석]
위스콘신 유방암 데이터셋을 대상으로 분류기법 2개를 적용하여 기법별 결과를 비교하시오.
(종속변수는 diagnosis: Benign(양성), Malignancy(악성))
[다중 회귀 분석, 랜덤포레스트]
mlbench패키지 내 BostonHousing 데이터셋을 대상으로 예측기법 2개를 적용하여 기법별 결과를 비교하시오.
(종속변수는 MEDV 또는 CMEDV를 사용)
'R' 카테고리의 다른 글
[R] 시각화 패키지 비교 (0) | 2023.05.03 |
---|---|
[R] 텍스트 데이터 분석 (0) | 2023.05.03 |
[R] 전세계 코로나19 추이 분석을 통한 글로벌 피해도 및 소외 지역 파악 (0) | 2023.05.03 |