1. 데이터 사이언스란 무엇인가? 1.1 컴퓨터 과학, 데이터 사이언스, 실제 과학 1.2 데이터에 대해 흥미로운 질문 던지기 1.3 데이터의 속성 1.4 분류와 회귀 1.5 데이터 사이언스 텔레비전:The Quant Shop 1.6 전쟁 이야기에 대해 1.7 전쟁 이야기: 올바른 질문에 답하기 1.8 장 노트 1.9 연습문제
2. 수학적 예비지식 2.1 확률 2.2 기술 통계 2.3 상관 분석 2.4 로그 2.5 전쟁 이야기: 유전자 설계의 적합도 2.6 장 노트 2.7 연습문제
3. 데이터 멍잉 3.1 데이터 사이언스를 위한 언어 3.2 데이터 수집 3.3 테이터 정제 3.4 전쟁 이야기: 시장 공략 3.5 크라우드 소실 3.6 장 노트 3.7 연습문제
4. 점수와 순위 4.1 제질량 지수 4.2 점수화 시스템 개발 4.3 Z-스코어와 정규화 4.4 고급 순위 기법 4.5 전쟁 이야긱: 클라이드의 복수 4.6 애로우의 불가능성 정리 4.7 전쟁 이야기: 누가 더 중요한가? 4.8 장 노트 4.9 연습문제
5. 통계분석 5.1 통계 분포 5.2 분포로부터 표본 추출 5.3 통계적 유의성 5.4 전쟁 이야기: 젊음의 샘을 발견하기? 5.5 순열검정 및 p-값 5.6 베이지안 추론 5.7 장 노트 5.8 연습문제
6. 데이터 시각화 6.1 탐험적 데이터 분석 6.2 시각화 미학의 개발 6.3 차트 타입 6.4 위대한 시각화 6.5 그래프 판독 6.6 대화식 시각화 6.7 전쟁 이야기: 세계를 TextMap으로 표현 6.8 장노트 6.9 연습문제
7. 수리적 모형 7.1 모형화 원리 7.2 모형의 분류 7.3 기준 모형 7.4 모형 평가 7.5 평가 환경 7.6 전쟁이야기: 100%정확도 7.7 모의실험 모형 7.8 전쟁 이야기: 계산된 베팅 7.9 장 노트 7.10 연습문제
8. 선형 대수 8.1 선형 대수의 힘 8.2 행렬 연산의 시각화 8.3 행렬 분할 8.4 고윳값과 고유벡터 8.5 고윳값 분해 8.6 전쟁 이야기: 휴먼 인자 8.7 장 노트 8.8 연습문제
9. 선형회귀 및 로지스틱회귀 9.1 선형회귀 9.2 더 좋은 회귀모형 9.3 전쟁 이야기: 택시 운전사 9.4 매개변수 적합으로서의 회귀 9,5 벌점화를 통한 모형 단순화 9.6 분류와 로지스틱회귀 9.7 로지스틱 분류의 이슈 9.8 장 노트 9.9 연습문제
10. 거리와 네트워크 방법 10.1 거리 측정 10.2 최근접 분류 10.3 그래프, 네트워크, 거리 10.4 PageRank 10.5 클러스터링 10.6 전쟁이야기: 클러스터 폭격 10.7 장 노트 10.8 연습문제
11. 기계학습 11.1 나이브 베이즈 11.2 의사 결정 트리 분류기 11.3 부스팅과 앙상블 학습 11.4 서포트 벡터 기계 11.5 지도의 정도 11.6 딥러닝 11.7 전쟁이야기: 이름 게임 11.8 장 노트 11.9 연습문제
12. 빅테이터: 규모의 달성 12.1 빅 데이터란 무엇인가? 12.2 전쟁 이야기: 인프라 구조가 중요하다 12.3 빅 데이터를 위한 알고리즘 12.4 필터링과 샘플링 12.5 병렬성 12.6 MapReduce 12.7 사회 및 윤리적 암시 12.8 장 노트 12.9 연습문제