엑셀을 활용한 데이터 과학 실무 입문

웹 크롤링부터 데이터 분석, 시각화와 머신러닝 구현까지

여러분의 데이터를 가치있게 활용할 수 있는 방법을 안내해 드립니다!

흩어져 있는 데이터를 필요에 맞게 수집하고 분석할 수 있는 형태로 만들어 이를 상황에 맞게 해석하지 못한다면 아무리 많은 데이터가 있어도 소용없는 쓰레기 더미에 지나지 않는다.

이 책에서는 데이터 분석을 어렵게 만드는 프로그래밍 언어와 복잡한 이론들은 최대한 멀리하고 데이터의 기초 개념부터 차근차근 설명한다. 또한 가장 손쉽게 다룰 수 있는 마이크로소프트 엑셀과 무료 애드인 프로그램을 활용해서 누구나 쉽게 예제를 따라 해 볼 수 있게 구성했다.

또한 기초에 해당하는 데이터 수집과 가공뿐만 아니라 시각화와 머신러닝으로 대표되는 고급 데이터 활용에 대해서도 다루고 있다. 이를 통해 데이터 과학이 꼭 파이썬이나 R과 같은 코딩지식을 통해서만 배울 수 있는 전문 지식이 아니라 엑셀 표 데이터에서부터 시작할 수 있는 친근한 개념이라는 것을 이야기하고자 했다.

 

도서 상세 이미지

김보겸

경영학을 전공하고 은행에서 첫 사회생활을 시작했다. 매일밤 이어지는 야근을 피하기 위해 엑셀의 데이터 관리 기능에 관심을 갖기 시작했고 이내 엑셀의 편리함에 빠져들었다. 엑셀 VBA(Visual Basic Application)를 통해 프로그래밍에 입문하여 코딩의 장벽을 넘나들고 있으며 은행을 나와 밴처기업을 창업 했지만 부족한 준비로 인해 실패하고 대신 인류를 이롭게 하는 국제개발사업에 매료되어 국제 구호 개발 기구인 월드비전에 입사했다. 월드비전에서는 예산 수립과 비용 분석 등을 담당하였고 우간다 개발 현장에 파견되어 개발 사업을 직접 실행했다. 이 때 사업의 방향성 설정과 성과분석 등을 위한 데이터의 중요성을 깨닫고 데이터에 대한 연구를 다시금 시작하여 엑셀을 바탕으로 하는 데이터 분석과 시각화 그리고 머신러닝에 대해 연구하고 있다. 코딩 대신 쉬운 도구를 사용하여 데이터를 분석하는 방법을 찾고 있으며 그 일환으로 마이크로소프트 데이터 분석 및 시각화 프로그램인 파워비아이 관련 블로그를 운영하고 있다. 은행 재직을 계기로 각종 금융관련 자격증을 취득하였으며 국제재무분석사(CFA) 시험에 합격하였고 기전대학교에서 재무분석 및 파생상품 강의를 진행했다. 현재는 월드비전 국제사업 전략팀에서 국제사업 예산 관리와 비용 분석을 담당하고 있다.

  • [1부] 데이터 분석 기초
    • ▣ 01장:데이터 분석 환경 구축
      • 1.1 데이터 분석
        • 1.1.1 데이터란 무엇인가?
        • 1.1.2 데이터 분석의 실체
        • 1.1.3 데이터 분석 방법
        • 1.1.4 데이터 분석의 목적
        • 1.1.5 데이터 분석 단계
        • 1.1.6 데이터 분석의 한계와 분석 실패 이유
        • 1.1.7 데이터 분석과 통계학의 관계
      • 1.2 데이터 분석 도구
        • 1.2.1 데이터 분석 도구별 특징
        • 1.2.2 목적에 맞는 도구 선택
      • 1.3 데이터 구조화
        • 1.3.1 데이터는 곧 테이블이다
        • 1.3.2 테이블의 구성 요소
        • 1.3.4 데이터와 쿼리
        • 1.3.5 관계형 데이터베이스
      • 1.4 정리
    •  
    • ▣ 02장: 데이터 분석 첫걸음: 데이터 수집
      • 2.1 엑셀과 파워쿼리를 활용한 데이터 전처리
        • 2.1.1 파워쿼리 소개
        • 2.1.2 파워쿼리 기본 활용
        • 2.1.3 데이터 그룹화와 계산열 만들기
        • 2.1.4 흩어져 있는 데이터 하나로 통합하기
      • 2.2 웹 데이터 수집
        • 2.2.1 엑셀을 활용한 웹 데이터 수집 기초
        • 2.3.2 RSS 피드를 통해 데이터 불러오기
        • 2.3.3 파워쿼리 M 코드를 활용한 웹데이터 수집 자동화
        • 2.3.4 특정 페이지 소스를 RSS 피드로 만들어 가져오기
        • 2.3.5 API를 통한 웹 데이터 수집
      • 2.3 데이터 쿼리와 언피벗팅
        • 2.3.1 쿼리(Query)와 엑셀 고급 필터링
        • 2.3.2 기초 데이터 테이블화
      • 2.4 정리
    •  
  • [2부] 실전 데이터 분석
    • ▣ 03장: 엑셀을 활용한 데이터 분석 기초
      • 3.1 엑셀 피벗 테이블로 데이터를 요약하고 분석하기
        • 3.1.1 피벗 테이블 기본 사용법
        • 3.1.2 피벗 테이블을 활용한 기본 데이터 분석
        • 3.1.3 피벗 테이블의 유용한 기능
        • 3.1.4 파워피벗을 통한 대용량 데이터 피벗팅
      • 3.2 엑셀 추가 기능을 활용한 데이터 분석
        • 3.2.1 데이터의 대푯값과 분포
        • 3.2.2 변수들의 관계를 말해주는 회귀 분석
      • 3.3 엑셀의 해 찾기 기능을 통한 데이터 분석
        • 3.3.1 엑셀의 해 찾기 기능 활용
      • 3.4 정리
    •  
    • ▣ 04장: 데이터 시각화
      • 4.1 데이터 시각화 이해하기
        • 4.1.1 데이터 시각화의 의미
        • 4.1.2 데이터 시각화 도구
        • 4.1.3 마이크로소프트 파워비아이
        • 4.1.4 파워비아이를 활용한 데이터 시각화 기초
        • 4.1.5 파워비아이를 활용한 데이터 시각화 심화
        • 4.1.6 엑셀 차트기능을 활용한 데이터 시각화
        • 4.1.7 파워비아이와 R을 활용한 데이터 시각화
      • 4.2 정리
    •  
    • ▣ 05장: 데이터 활용: 쉽게 배워보는 머신러닝
      • 5.1 머신러닝이란 무엇인가?
        • 5.1.1 머신러닝의 실체
        • 5.1.2 머신러닝과 데이터
        • 5.1.3 알고리즘과 기계 학습 방법
        • 5.1.4 투자 의사 결정을 위한 데이터 군집화
      • 5.2 머신러닝 모델 만들기
        • 5.2.1 머신러닝 프레임워크
        • 5.2.2 애저 코그니티브 서비스를 활용한 워드 클라우드 보고서 만들기
        • 5.2.3 마이크로소프트 애저 머신러닝 스튜디오
      • 5.3 정리
    •  
  • ▣ 부록A: R과 R 스튜디오 설치
    • A.1 R 설치
    • A.2 R 스튜디오 설치
    • A.3 자바 설치