혜주's life

[데이터사이언스 스쿨] 2개월차 수강후기 본문

Study/zero_base

[데이터사이언스 스쿨] 2개월차 수강후기

쭈블리 2022. 3. 31. 18:26

1개월차 수강후기를 남긴 후 벌써 또 한달이 지나갔당 ,,

아침 10시에 시작해서 밤 10시, 혹은 더 늦게는 새벽까지 강의를 듣기도 하다보니

1달이 훌쩍 지나가 버린 느낌이다 :(

순식간에 훅 지나가버린 그동안 1달간의 후기를 또 남겨보려고 한다 ! !


데이터사이언스 스쿨 2개월차 체감 난이도는???

2개월차 역시 쉽지 않은 한 달이었다고 할 수 있다.!

1개월차에는 제일 기본적인 기초수학부터 파이썬에 대해 전반적으로 배우고, 자료구조와 알고리즘 등

내가 생애 처음으로 접해보는 것들이 역시 대부분이었다! !

모르는 부분들은 또 다시 들어보고 스터디원들과 매일 문제를 풀어가며 복습을 하다보니

맨 처음 제로-베이스였던 나에서 그래도 조금.?은 성장해 나가고 있다고 생각했다 ㅎ.ㅎ


그렇게 1개월차를 모두 끝낸 후 2개월차로 들어서며 또 ! 다른 새로운 것들이 나를 반겨주었다.

1개월차에 배웠던 파이썬을 기반으로 파이썬을 본격적으로 사용해 데이터를 조작, 수집, 시각화까지 하는

'EDA' 를 처음 배우기 시작했다. 

EDA란 말이 처음에는 매우 생소했는데, 간단히 말하자면 데이터를 수집해 알아보기 쉽게 시각화를 한 후 이를 토대로

수집한 데이터를 분석해 보는 과정이었다!

파이썬은 1개월차에 배웠지만, 다른 모듈은 처음 써보는 것들이 많아 강의가 아니었다면 엄청 헤맸을 것 같다ㅠ ㅠ

하지만 제로베이스 데이터사이언스 스쿨의 강사진 분들이 하나부터 열까지 과정을 상세하게 설명해 주셔서

그대로 따라하다 보니 여러 개의 EDA 분석을 끝마칠 수 있었다! !


우선 2개월차 강의는 '이론'파트와 '실습'파트로 구성되어 있었다.!

처음 이론강의를 들으며 각 파트마다 필요한 개념과 이론들을 이해한 후

실습파트에서는 강사님이 이론 시간에 배웠던 부분들을 직접 진행하는 모습을 보여주며

나도 실습강의를 보며 직접 따라하며 진행할 수 있었다.

덕분에 처음 접하는 나도 강의를 따라가기에는 문제가 없는 듯 보였다!

강의를 따라가다 중간에 문제가 생겨 실행이 안될 때도 있었는데 이런 문제는 보통 구글링을 통해

손쉽게 해결할 수 있는 문제였고, 이 방법이 안될 때는 슬랙을 통해 강사님에게 직접 문의하여

바로바로 피드백을 받을 수 있었다.!


이렇게 처음엔 저장되어 있는 csv파일을 pandas로 불러와 내가 원하는대로 칼럼과 내용들을 바꿔나갔다!

데이터 프레임의 index 설정부터 안의 정보를 확인하고, 특정 컬럼을 기준으로 데이터를 정렬하는 방법,

두 데이터 프레임을 합쳐 한번에 볼 수 있는 방법 등을 거쳐 내가 자료를 분석하고 시각화하기

가장 최적의 데이터 프레임을 만들어 나갔다!


그래프 안에 격자무늬 생성, 그래프 제목 추가, x축과 y축의 제목 추가, 두 개의 선을 구분지어 데이터 의미를 구분짓는

방법 등을 배웠고,

그래프를 실선이 아닌 점선으로 나타내는 방법도 배울 수 있었다!


이렇게 내가 정리한 데이터를 막대그래프로 나타내니 확실히 조금 더 데이터를 보기 쉽다는 생각을

할 수 있었다

이처럼 boxplot으로 흡연자와 비흡연자를 나누는 그래프도 만들어 봤고,

heatmap을 그려보기도 해 보았다!

위에서 분석하고 정리한 데이터를 heatmap을 통해 나타내보는 방법 !

위와 같이 정규화된 5대 범죄 발생 건수를 지도 위에 나타내는 등

정말 다양한 그래프를 접할 수 있었고,

분석한 데이터를 시각화하여 나타내 보았다는 점이 너무 흥미롭고 새로웠다!


이 외에도 데이터를 csv로 불러오는 것이 아닌 직접 웹에서 '크롤링'을 해 와서 작업하는 방법,

이렇게 갖고 온 데이터를 또 내가 원하는대로 정리하고 데이터프레임에 넣어 저장하는 방법까지

여러가지의 작업들을 계속 반복하고 또 반복하는 과정을 하는 한 달이라고 할 수 있었다.!!

하지만 이렇게 실습을 보며 따라하는 것과 실제 EDA과제를 수행해보는 것은 정말 큰 차이가 있었다.

과제를 직접 수행할 땐 내가 직접 어떻게 데이터를 웹 크롤링 해 와서 어떻게 분석을 하는 지에 따라

다양한 형태의 그래프가 나올 수 있었고,

어느 관점에서 보느냐에 따라 사람마다 다 다른 분석 결과가 나올 수 있다는 것을 느낄 수 있었다!


이번 한 달은 EDA와 웹 크롤링에 대해 학습을 많이 했지만,

다른 EDA 결과물을 보면 아직 많은 학습이 더 필요하다는 것을 느꼈고,

과제 이외에도 내가 분석해 보고 싶은 데이터가 있다면 그것을 직접 정리하고 시각화까지 해

분석해 보는 과정을 해 보고 싶다는 생각을 하게 되는 시간이었다

 

* 이 글은 소정의 대가를 받고 작성됨

'Study > zero_base' 카테고리의 다른 글

[데이터사이언스 스쿨] 1개월차 수강후기  (0) 2022.02.28
Comments