데이터 분석
1. 데이터 분석의 목적
데이터 분석은 근본적으로 더 큰 가치를 창출하기 위한 객관적 자료를 제시합니다.
-
제 20대 친구들은 모두 애니메이션을 좋아합니다.
-
20대 사용자 30,000명의 검색 데이터를 조회한 결과 20대는 애니메이션을 좋아하는 것으로 판명되었습니다.
어떤 근거가 더 신뢰도가 높고 객관적이라고 생각하시나요?
사람마다 데이터 분석을 이용하고자 하는 이유는 다르지만 주로 의사결정을 하기 앞서 판단에 도움을 주기 위해서 행해집니다.
- 수집한 데이터에서 어떤 가치를 뽑아내었는가
- 데이터를 분석하여 어떤 것을 얻어 내고자 하는가
- 데이터를 통해 올바른 의사결정을 할 수 있는가
그렇기에 데이터 분석을 행하기 위해서 위와 같은 3가지를 고려해야합니다
2. 데이터 분석은 어떻게 진행되는가
데이터 분석은 다음과 같은 4가지 프로세스로 진행됩니다.
- 데이터 수집
- 데이터 탐색
- 데이터 전처리
- 데이터 모델링
각 프로세스의 상세는 추후에 다시 한번 다룰 예정이나 간략하게 설명한다면
-
데이터 수집 - 다양한 곳에 존재하고 있는 데이터들을 자신의 서버로 긁어 오는 것을 뜻합니다.
-
데이터 탐색 - EDA(Elective Data Analasis)라고도 하며 데이터를 목적에 맞게 분류하는 작업입니다.
-
데이터 전처리 - 날 것(raw)상태의 데이터를 사용할 수 있도록 가공하는 작업입니다.
-
데이터 모델링 - 실제로 데이터를 사용하여 의미있는 지표를 만드는 단계입니다.
마치며
오늘은 데이터 분석은 왜 행해지며 어떤 프로세스로 진행되는가에 대해 간략하게 알아보았습니다.
다음에는 데이터 분석을 위해 어떤 툴을 사용할 것인가, 그리고 그 툴을 위한 환경설정방법을 알아보고자 합니다.