R 4

[R] 시각화 패키지 비교

보고서 : 문제 1) 막대 차트(가로, 세로), 누적막대 차트, 점 차트, 원형 차트, 상자 그래프, 히스토그램, 산점도, 중첩자료 시각화, 변수간의 비교 시각화, 밀도그래프를 교재 내 데이터를 이용하여 시각화하시오. 문제 2) 문제 1)에서 사용한 데이터를 이용하여 ggplot2 패키지 내 함수를 이용하여 같은 그래프로 시각화하시오. ggplot2 패키지 내 함수로 시각화가 되어 있거나 ggplot2 패키지 내 해당 함수가 없는 경우 다른 시각화 패키지를 사용하여 시각화하시오.

R 2023.05.03

[R] 텍스트 데이터 분석

보고서 : 제공된 데이터를 대상으로 텍스트 분석을 실행하시오. 제공된 데이터는 2022 년 2월 19일 젤렌스키 우크라이나 대통령의 성명의 국문 번역문이다. 문제 1) 제공된 데이터를 이용하여 토픽 분석을 실시하여 단어구름으로 시각화 하고 단어 출현 빈도수를 기반하여 어떤 단어들이 주요 단어인지 설명하시오. (두 글자 이상의 단어 대상 / 빈도수 1인 단어 제외) 문제 2) 제공된 데이터를 이용하여 연관어 분석을 실시하여 연관어를 시각화 하고 시각화 결과에 대해 설명하시오. (지지도와 신뢰도 설정 설명 포함)

R 2023.05.03

[R] 통계 분석 / 머신러닝 분석

보고서 : [다중 회귀 분석] 다음 사항을 적용하여 다중회귀분석을 실시하시오. R의 내장 데이터셋인 state data sets 내 stat.x77 데이터셋 사용 문제 1-1) state 데이터셋을 load하고, state.x77 dataset을 데이터프레임으로 변환하고, Life Exp 변수를 Life.Exp로 HS Grad변수를 HS.Grad로 변경하시오. 문제 1-2) Life Expectancy 변수를 종속변수로 설정하고 나머지 변수를 독립변수로 설정하여 회귀분석을 실시하시오. 실시 후 결과에 대해 해석하시오. 문제 1-3) 문제 1-2)의 회귀모형에서 Income, Illiteracy, Area 변수를 제외하고 회귀분석을 실시하고 결과에 대해 해석하시오. 문제 1-4) Life Expectanc..

R 2023.05.03

[R] 전세계 코로나19 추이 분석을 통한 글로벌 피해도 및 소외 지역 파악

1. 서론 1) 데이터 분석 배경 2023년 현재, 지난 2020년부터 세계를 강타한 코로나 19 팬더믹이 위드 코로나(With Covid19) 시대로 완전히 넘어가고 있다. 이로 인해 국경 이동의 자율성과 높은 경제순환율 등이 세계적으로 높아지고 있다. 하지만 여전히 위드 코로나 정책에 대한 불안함을 지닌 의견들도 존재한다. 코로나19는 높은 치사율과 변이성을 보이고 있는 특이체라는 이유가 주된 근거이다. 이러한 불안감을 최소화하기 위해, 각 국가는 지속적인 코로나 바이러스 대응 구축이 필수적이다. 따라서 이 보고서에서는 코로나 바이러스에 대한 장기/지속적인 대응 플랜을 우선적으로 마련해야 하는 국가를 나타내고자 한다. 즉, 이 보고서를 통해 코로나19 바이러스에 영향을 크게 받은 국가를 확인할 수 있..

R 2023.05.03