모든 응용 프로그램이 그렇듯 일단 프로그램에 익숙해지고 적응하기만 하면 그다음부터는 다루기 편하다. 데이터 과학 도구로 다양한 오픈 소스 소프트웨어들이 제공되는데 이 책에서 살펴볼 소프트웨어는 SAS ODA다. SAS ODA는 상용 소프트웨어 개발사에서 제공되는 소프트웨어 중 유일하게 무료로 제공되며 포춘 100대 기업 중 94%가 사용하는 검증된 도구로 신뢰도가 높다. 또한 뛰어난 기능성으로 기초 통계부터 다변량 분석 같은 고급 분석까지 코딩 없이 쉬운 사용자 인터페이스를 지원한다. 확장성과 접근성이 높다는 것도 초보자가 입문하기 좋다는 장점이 갖고 있다. SAS ODA에 접속하여 서비스 가입한 뒤 사용해 본 바로는 이 책에 나온 예시를 따라 해보는 것만으로도 이미 적응은 끝난다.
이미 엑셀이라는 강력한 통계 데이터 소프트웨어가 있지만 SAS ODA는 매우 다양한 데이터 분석 도구를 제공해 준다는 점이다. 심지어 한글판이라 다루기도 쉽다. 저자가 제공하는 라이브러리를 다운로드해 예시들을 따라 해보면서 결괏값이 어떻게 나오는지 확인해 보자. 코딩 없이도 엑셀 프로그램을 다루듯 몇 번의 클릭으로 원하는 결과를 얻을 수 있다. SAS Studio 맛보기만 제대로 시작해도 그다음 실습은 책에 나온 대로 보고 눌러보면 된다. 중요한 것은 데이터 과학을 위한 기본 지식, 데이터 분석 및 변환 도구에 대한 이해다. 현재 미국에서는 데이터 과학자가 인기를 끌고 있는데 임금이 높고 구인란을 겪고 있으며 수요가 계속 증가하고 있기 때문이다. 공급이 수요를 따라가지 못하는 것이 주요인이다.
이러한 데이터 과학자 품귀 현상은 앞으로 계속될 것이란 전망이 나오고 있는데 국내 상황도 마찬가지로 데이터 과학자 부족 현상은 앞으로 더 심화될 것으로 예측하고 있다. 데이터 과학자에 대한 정의는 아래와 같다. 데이터에서 통계적 지식과 프로그래밍으로 인사이트를 만들어 내는 사람으로 데이터 과학자가 갖춰야 할 역량으로 데이터 분석 역량, 비즈니스 역량, 컴퓨팅 역량을 들 수 있다.
"데이터 과학자는 프로그래밍 코드와 통계적 지식을 결합하여 데이터로부터 통찰력을 만들어 내는 사람이다."
데이터 과학자는 전공과 무관하게 누구나 될 수 있으며, 현재 가지고 있는 역량을 충분히 활용하여 비전공자라도 어렵지 않게 데이터 과학자가 될 수 있다고 한다. '시민 데이터 과학자'로 불리는 이들은 기존 산업 전문가들에게 데이터 분석을 재교육해 활용한다는 특징을 지니고 있다. 과학적인 방법으로 데이터를 분석하는 특성상 '변수'의 유형과 역할을 정확히 이해해야 하는 것이 필수적이다. 그래서 데이터들을 취합하여 이를 분석하는 작업이 중요하다. 실습을 해본 결과 이 책을 교재 삼아 연습하는데 큰 어려움은 없었다. 이 책을 계기로 데이터 과학을 알게 되었고 앞으로 빅데이터와 통계 자료들이 중요해진 시대에서 데이터 과학 입문서로써 손색없는 책이었다.
'· 서평(Since 2013 ~)' 카테고리의 다른 글
[서평] 라이어스 : 기만의 시대, 허위사실과 표현의 자유 (0) | 2023.04.06 |
---|---|
[서평] 하루 3분, 꺼내 먹는 자본주의 : 화폐와 금리부터 부의 축적 원리까지, 세상에서 가장 짧은 자본주의 수업 (0) | 2023.04.05 |
[서평] 누구나 할 수 있는 NFT 아트테크 : 미술과 재테크를 몰라도 (0) | 2023.04.05 |