Python

[Python] 캐글(kaggle) 필사 전략

seo0seok 2023. 6. 20. 19:59

// 퇴근후딴짓 님의 강의를 참고하였습니다. //

 

1. 캐글 회원가입 및 로그인하기

https://www.kaggle.com/

 

2. Competitions(경연 대회) 클릭

 

3. 입문자가 가장 많이 해보는 Titanic Dataset 클릭

 

4. Code 클릭

 

5. Titanic Tutorial 클릭

→ 우측에 보이는 숫자가 UP 버튼으로 가장 높은 숫자의 코드를 봐도 되나 입문자가 따라하기에는 어렵다.

→ 이때 검색창에 tutorial / starter / simple 단어로 검색하면 입문자용 코드를 찾을 수 있다.

 

6. 코드 필사하기

→ 인터넷 창을 한 개 더 띄워 똑같이 Titanic Dataset 클릭하여 들어온 후 New Notebook 버튼을 클릭한다.

→ Notebook 버튼 클릭하면 note가 나오게 된다.

 

→ File 클릭 후 Editor Type에서 Notebook 형태와 Script(시험 환경 유사) 형태로 바꿀 수 있다.

 

→ Titanic Tutorial 클릭 후 글쓴이의 코드를 따라 써보면서 공부를 하면된다.

 

→ 코드를 전부 입력 후 Run All을 클릭해 제출용 csv 파일까지 만들었다면 오른쪽에 Output에 csv이 저장이 된다.

→ Download를 클릭해 PC에 저장시켜준다.

 

→ 그 후 Save Version을 클릭한다.

 

→ Save 버튼을 Notebook을 저장한다.

 

 

7. csv 파일 제출 후 점수 보기

→ Titanic Tutorial -> Leaderboard -> Submit Predictions

→ Browse Files를 클릭 후 위에서 Download 받은 csv 파일을 업로드한다.

→ DESCRIPTION은 코드에 대한 설명을 작성하는곳이다.

 

→ 업로드가 완료되면 Submit 버튼을 클릭한다.

 

→ 내가 모델링한 모델의 평가 점수가 나온다 1에 가까울수록 좋다.

 

→ 다시 Learderboard로 돌아와 Jump to your leaderboard position을 클릭하면 내 등수와 점수가 나온다.

→ Tutorial 코드를 그대로 사용했을때 평가 점수는 0.77511 / 등수는 9686등이다.

 

→ 실력이 향상된 후 나만의 모델 튜닝을 통해 평가 점수와 등수를 올리는 것이 큰 재미가 될 것 같다.