[데이터 시각화] 2018년 미국 데이터 과학자 취업 시장 전망


Original Article by Silvia Lu (NYC Data Science Academy Blog) Translated by JJ Hwang



데이터 과학자를 꿈꾸는 분들에게 드리는 필독 메시지


1. 직무 기술서를 정독하세요.

2. 필수 툴 top 5 : Python, SQL, R, Excel, Scala

3. 필수 스킬 top 5 : Machine Learning, Modeling, Optimization, Data Visualization, Artificial Intelligence

4. 최선호 학위 : 석사와 박사

5. 최선호 전공 : 컴퓨터 과학, 통계학, 수학, 계량화 관련 전공

최근 발간된 LinkedIn Workforce Report August 2018은 미국에서 데이터 과학자로 취업을 원하는 분들에게 아주 좋은 소식이 될 것 같습니다. 이 보고서에 따르면 데이터 과학 관련 역량을 갖춘 분들이 무려 151,717명이 부족합니다. 특히 뉴욕, 샌프란시스코, 로스엔젤레스에서는 인력난이 극심합니다.

직장을 구하시는 분들에게 도움이 되기 위해, 2018년 8월 3일 Indeed 사이트를 웹크롤링/웹스크래핑하여 약 7,000건의 미국 데이터 과학자 채용 관련 데이터를 수집하였습니다. 수집한 데이터는 아래와 같습니다. (본 데이터셋은 Kaggle에 올려 놓았습니다)

1. 회사 이름

2. 직무 이름

3. 지역

4. 직무 기술

5. 회사 리뷰 수


데이터 과학자에게 필요한 툴과 스킬


직무 기술에 가장 많이 언급된 핵심 툴은 Excel, Python, SQL, 핵심 스킬은 Machine Learning, Modeling, Optimization 이었습니다. 예상과 달리 고용하는 회사가 원하는 가장 원하는 툴은 Excel이었네요. 직무 기술의 83%에서 Excel이 포함되어 있습니다.


전공과 학위 관련


컴퓨터 과학이 여전히 최고 인기입니다. 통계학, 수학, 경제학과 같은 계량화 관련 전공들이 그 뒤를 잇고 있습니다. 놀랍게도 데이터 과학이라는 전공은 직무 기술 100개 중 오직 4번 정도 밖에 언급되지 않았는데요, 이는 기업들이 아직 미국에서 데이터 과학이라는 전공이나 학과가 그리 많지 않다고 생각하는 데서 연유한 것으로 보입니다.





기업은 지원자들의 필수 보유 역량을 잘 알고 있을까?


결론부터 이야기하자면, 기업도 잘 모르고 있는 것 같습니다. 로지스틱 회귀분석이나 랜덤 포레스트에 관한 면접을 준비했는데 정작 면접이 화이트보드 코딩의 알고리즘 문제에 대한 이야기로 흐르는 경험을 해보셨을 겁니다. 기업이 데이터 과학자를 뽑으려는 건지 소프트웨어 엔지니어를 뽑으려는 건지 헷갈릴 정도입니다.

이 문제를 풀기 위해 모든 직무를 3개의 그룹으로 나누었습니다. 엔지니어, 데이터 과학자, 그리고 데이터 분석가로 말이죠. 이 세 그룹의 직무 기술을 비교함으로써, 세 그룹 사이 직무, 학위, 전공, 최우선 선호 사항에 대한 명확한 구분이 가능한지 알아보고 싶었습니다.

엔지니어(붉은색) vs. 데이터 과학자(푸른색) vs. 데이터 분석가(노란색) : 툴


위 그래프는 세 그룹의 툴 빈도에 관한 것입니다. 각각의 바에 쓰여있는 숫자는 각 그룹 내 툴 빈도의 순위이고, 각각의 바의 길이는 각 그룹의 직무 기술에서 이 툴이 얼마나 자주 언급 되었는가를 보여줍니다. 바의 길이가 길수록, 기업에서 그 툴을 더 많이 원하고 있다는 뜻입니다. 예를 들어 데이터 과학자의 경우, 가장 선호되는 툴은 Python, SQL, R, Excel, Scala인데 이는 엔지니어에게 프로그램 언어가 중요한 것과는 상반된 경향이라고 할 수 있습니다. 데이터 과학자와 데이터 분석가 사이에서는 사용하는 툴에 관한 큰 차이점은 없어 보입니다.

엔지니어(붉은색) vs. 데이터 과학자(푸른색) vs. 데이터 분석가(노란색) : 스킬


스킬에 관해서는, 엔지니어에게 요구되는 것은 오직 artificial intelligence 뿐이라는 것을 알 수 있습니다. 데이터 과학자에게는 Machine Learning, Modeling, Statistical Analysis, 데이터 분석가에게는 Data Analysis, Data Visualization, Research가 요구되어지고 있네요.

엔지니어(붉은색) vs. 데이터 과학자(푸른색) vs. 데이터 분석가(노란색) : 학위와 전공



대체로, 데이터 과학자가 엔지니어나 데이터 분석가보다 석사 혹은 박사 등 더 높은 수준의 학위를 요구 받습니다. 전공은 데이터 과학자와 데이터 분석가에게는 특정의 전공이 요구되지 않는 반면, 엔지니어에게는 컴퓨터 과학 전공 선호가 두드러집니다. 계량화 관련 전공은 데이터 과학자와 데이터 분석가 양 쪽에 무난하게 선호되고 있네요.

결론


이 분석을 통해 결론을 내려본다면 “데이터 과학자”와 “데이터 분석가”라는 타이틀로 올라 온 채용 공고는 요구되는 툴, 스킬, 학위, 전공 등의 항목에서 겹치는 부분이 많습니다. 일자리를 원하는 분들은 직무 기술을 잘 읽어보고 현명한 판단을 내려야 하겠습니다.

다시 원래의 질문으로 돌아가 보죠. 과연 어떤 사람이 채용되는가? 계량화 관련 전공에서 석사 학위 또는 그 이상의 학위 보유, Python, SQL, Excel, R, Scala를 능숙하게 쓸 줄 알면서, Machine Learning, Modeling, Optimization, Data Visualization, Artificial Intelligence에 정통한 사람입니다. 무엇보다도 기업이 올린 직무 기술을 면밀히 검토하는 사람이 채용에 성공할 것입니다!

(소스는 여기에, 파워포인트 자료는 여기에 올려 놓았습니다)


========================= 스파이더킴 (www.spiderkim.com) 웹크롤링, 웹스크래핑, 웹데이터 수집, 빅데이터에서 최고의 서비스를 제공합니다. 지금 바로 홈페이지를 방문하셔서, 문의 요청해 주십시오!

조회 99회

​고객센터

Tel: 02-596-8900  Fax : 02-6930-5709

10시 - 오후 7시(토, 일요일 및 공휴일은 휴무)

개인정보관리책임자 : 황재준   상호 : 유펜솔루션   대표자 : 김재훈   사업자등록번호 : 426-86-00939
주소 : (본사)대전광역시 유성구 엑스포로446번길 38, 3층 302호 / (지사 및 연구소)서울시 성동구 연무장 15길 11, B동 2층
​ⓒ 2019 UpennSolution Co., Ltd. All rights reserved.