R

[R] 통계 분석 / 머신러닝 분석

seo0seok 2023. 5. 3. 11:45

보고서 :

다중 회귀 분석 보고서.pdf
0.40MB
시계열 분석 보고서.pdf
0.61MB
로지스틱 회귀 분석 보고서.pdf
0.52MB
XGBOOST, 로지스틱 회귀 분석 보고서.pdf
0.39MB
다중 회귀 분석, 랜덤포레스트 분석 보고서.pdf
0.52MB

[다중 회귀 분석]

다음 사항을 적용하여 다중회귀분석을 실시하시오. R의 내장 데이터셋인 state data sets 내 stat.x77 데이터셋 사용

 

문제 1-1) state 데이터셋을 load하고, state.x77 dataset을 데이터프레임으로 변환하고, Life Exp 변수를 Life.Exp로 HS Grad변수를 HS.Grad로 변경하시오.

 

 

문제 1-2) Life Expectancy 변수를 종속변수로 설정하고 나머지 변수를 독립변수로 설정하여 회귀분석을 실시하시오. 실시 후 결과에 대해 해석하시오.

 

 

문제 1-3) 문제 1-2)의 회귀모형에서 Income, Illiteracy, Area 변수를 제외하고 회귀분석을 실시하고 결과에 대해 해석하시오.

 

 

문제 1-4) Life Expectancy 변수를 종속변수로 설정하고 HS.Grad와 Murder 변수를 예측변수(predictor variable)로 설정하여 회귀분석을 실시하시오.

 

 

문제 1-5) 전 인구의 55%가 고졸이고 살인비율이 10만명당 8명일 때 Life Expectancy 결과값을 예측하시오.

 

 

문제 1-6) 문제 1-4)에서 처럼 2개의 독립변수, 1개의 종속변수의 데이터와 fit된 회귀평면(fitted regression plane)을 3D 그래프로 시각화하시오.

 

 

[시계열 분석]

아래 site에서 제공된 데이터셋은 Johns’ Hopkis 대학 내 The Center For Systems Science and Engineering(CSSE) 에서 업데이트 하는 전세계 코로나(COVID-19) 발생 현황 데이터셋이다. 제공된 데이터셋 중 2021년 8월~2022년 7월 일간

데이터에서 R code로 다음을 수행하고 결과를 팀 별로 리포트 하시오.

 

문제 2-1) 추세선 확인

 

 

 

문제 2-2) 4가지 변동요인 분해

 

 

 

문제 2-3) 시각화

 

 

 

문제 2-4) 결과 해석

 

 

 

[로지스틱 회귀 분석]

mtcars 데이터에서 엔진(vs)을 종속변수로, 연비(mpg)와 변속기종류(am)를 독립변수로 설정하여 로지스틱 회귀분석을 

실시하시오.

 

문제 3-1) 데이터 가져오기

 

 

문제 3-2) 로지스틱 회귀분석 실행하고 회귀모델 확인

 

 

문제 3-3) 로지스틱 회귀모델 요약정보 확인

 

 

문제 3-4) 로지스틱 회귀식

 

 

문제 3-5) 결과 해석

 

 

[XGBOOST, 로지스틱 회귀 분석]

위스콘신 유방암 데이터셋을 대상으로 분류기법 2개를 적용하여 기법별 결과를 비교하시오.

(종속변수는 diagnosis: Benign(양성), Malignancy(악성))

 

 

 

 

 

[다중 회귀 분석, 랜덤포레스트]

mlbench패키지 내 BostonHousing 데이터셋을 대상으로 예측기법 2개를 적용하여 기법별 결과를 비교하시오.

(종속변수는 MEDV 또는 CMEDV를 사용)