4차 산업의 발전
요즘 데이터 사이언스가 굉장히 핫하다.
빅데이터, AI, 블록체인, NFT, 메타버스 등등.. 4차산업을 이끄는 주요 키워드들은 많이들 알고 있을 것이다.
이 모든 키워드를 관통하는 중요한 공통점은 바로 이것이다.
데이터 : 어떤 값을 포함하고 있는 가공되지 않은 1차 자료
IT의 발전과 4차산업의 부산물로 다양한 종류의 방대한 데이터가 넘쳐나게 되었고, 이를 가지고 새로운 비즈니스를 만들어가는 것이 하나의 트랜드가 되게 되었다.
이에 따라 데이터와 관련된 직군이 새롭게 생겨나게 되었고, 데이터 관련 업무는 3가지로 나뉜다.
- 데이터 엔지니어링
- 데이터 사이언스
- 데이터 분석
이 중 오늘은 데이터를 분석하기 위한 모델링을 주로 하는 업무인 데이터 사이언스에 대해 알아보도록 하자.
데이터 사이언스
데이터를 통해 실제 현상을 이해하고 분석하는데, 통계학, 데이터 분석, 기계학습과 연관된 방법론을 통합하는 과학적 방법론
- Data를 이용하는 과학의 분야 중에 하나
- Data 용어와 밀접한 관련이 있다.
e.g. Database, Data Engineering, Data Analysis, Data Literacy, … - 하나의 확정된 개념은 아니다. 아직 지속적으로 발전중이다.
→ 그래서 단체/기관마다 정의하는 DS의 개념이 조금씩 다르다. - Data Science를 업으로 삼는 사람들을
Data Scientist(DS)라고 한다. 그들이 하는 일을 살펴보면, DS가 어떤 일인지 조금 알 수 있다. - 각 회사들이 정의하고 있는 Data Scientist의 역할들을 살펴보면서 Data Science의 구성요소들에 대해서 알아가보자!
Job Description
- Google
Data Scientist, Operations Data Science - Google Careers
Data Scientist, Engineering - Google Careers - Naver
개발자 채용
네이버(주),[Search] 네이버 Data Science 데이터 분석 & 엔지니어 (신입/경력) : 인크루트 채용 - 타다
[타다(VCNC)] 타다(TADA) 데이터 사이언티스트 (비즈니스) 채용 | 원티드
요약
데이터 사이언티스트에게 요구하는 역량은 회사에 따라 비슷하다.
다만, 데이터 사이언스와 엔지니어링을 구분하지 않고 둘 다 할 줄 아는 사람을 원하는 경우가 종종 있었다.
즉, 만능인을 요구하는 경우가 많기 때문에 데이터 사이언티스트 연봉이 높은 게 아닐까 싶다.
회사에서 데이터 사이언티스트에게 요구하는 역량을 정리해보면 다음과 같다.
- Python (or R)
- SQL
- 통계, 산업공학, 컴퓨터공학 관련 전공
- 2년 정도 (또는 그 이상)의 현업 경험
- 머신러닝/딥러닝 프레임워크 기반 모델링 경험
- 대용량 데이터 프레임워크(Hadoop Ecosystem, Spark) 사용 경험
- 예측 모델링 기반 프로젝트 경험
- 클라우스 서비스(AWS, Azure, GCP) 사용경험
- 커뮤니케이션 역량
- 문제 해결 능력
데이터에 대한 이해도와 분석 역량을 주로 요구한다는 것을 알 수 있다.
또한, 데이터 분석&엔지니어링 경험을 우대사항으로 많이 걸어두고 있다.
그래도 확실한 사실은 통계분석, Python, SQL(DB), 머신러닝/딥러닝 역량은 필수라는 것이다!
이 역량들을 쌓기 위해 앞으로 많은 노력을 해야되겠다.
데이터 사이언티스트를 꿈꾸는 분들 모두 화이팅합시다!
Adios!
반응형