목차
1. 데이터 사이언스란 무엇인가?
1.1 컴퓨터 과학, 데이터 사이언스, 실제 과학
1.2 데이터에 대해 흥미로운 질문 던지기
1.3 데이터의 속성
1.4 분류와 회귀
1.5 데이터 사이언스 텔레비전:The Quant Shop
 1.6 전쟁 이야기에 대해
1.7 전쟁 이야기: 올바른 질문에 답하기
1.8 장 노트
1.9 연습문제

2. 수학적 예비지식
2.1 확률
2.2 기술 통계
2.3 상관 분석
2.4 로그
2.5 전쟁 이야기: 유전자 설계의 적합도
2.6 장 노트
2.7 연습문제

3. 데이터 멍잉
3.1 데이터 사이언스를 위한 언어
3.2 데이터 수집
3.3 테이터 정제
3.4 전쟁 이야기: 시장 공략
3.5 크라우드 소실
3.6 장 노트
3.7 연습문제

4. 점수와 순위
4.1 제질량 지수
4.2 점수화 시스템 개발
4.3 Z-스코어와 정규화
4.4 고급 순위 기법
4.5 전쟁 이야긱: 클라이드의 복수
4.6 애로우의 불가능성 정리
4.7 전쟁 이야기: 누가 더 중요한가?
4.8 장 노트
4.9 연습문제

5. 통계분석
5.1 통계 분포
5.2 분포로부터 표본 추출
5.3 통계적 유의성
5.4 전쟁 이야기: 젊음의 샘을 발견하기?
5.5 순열검정 및 p-값
5.6 베이지안 추론
5.7 장 노트
5.8 연습문제

6. 데이터 시각화
6.1 탐험적 데이터 분석
6.2 시각화 미학의 개발
6.3 차트 타입
6.4 위대한 시각화
6.5 그래프 판독
6.6 대화식 시각화
6.7 전쟁 이야기: 세계를 TextMap으로 표현
6.8 장노트
6.9 연습문제

7. 수리적 모형
7.1 모형화 원리
7.2 모형의 분류
7.3 기준 모형
7.4 모형 평가
7.5 평가 환경
7.6 전쟁이야기: 100%정확도
7.7 모의실험 모형
7.8 전쟁 이야기: 계산된 베팅
7.9 장 노트
7.10 연습문제

8. 선형 대수
8.1 선형 대수의 힘
8.2 행렬 연산의 시각화
8.3 행렬 분할
8.4 고윳값과 고유벡터
8.5 고윳값 분해
8.6 전쟁 이야기: 휴먼 인자
8.7 장 노트
8.8 연습문제

9. 선형회귀 및 로지스틱회귀
9.1 선형회귀
9.2 더 좋은 회귀모형
9.3 전쟁 이야기: 택시 운전사
9.4 매개변수 적합으로서의 회귀
9,5 벌점화를 통한 모형 단순화
9.6 분류와 로지스틱회귀
9.7 로지스틱 분류의 이슈
9.8 장 노트
9.9 연습문제

10. 거리와 네트워크 방법
10.1 거리 측정
10.2 최근접 분류
10.3 그래프, 네트워크, 거리
10.4 PageRank
 10.5 클러스터링
10.6 전쟁이야기: 클러스터 폭격
10.7 장 노트
10.8 연습문제

11. 기계학습
11.1 나이브 베이즈
11.2 의사 결정 트리 분류기
11.3 부스팅과 앙상블 학습
11.4 서포트 벡터 기계
11.5 지도의 정도
11.6 딥러닝
11.7 전쟁이야기: 이름 게임
11.8 장 노트
11.9 연습문제

12. 빅테이터: 규모의 달성
12.1 빅 데이터란 무엇인가?
12.2 전쟁 이야기: 인프라 구조가 중요하다
12.3 빅 데이터를 위한 알고리즘
12.4 필터링과 샘플링
12.5 병렬성
12.6 MapReduce
 12.7 사회 및 윤리적 암시
12.8 장 노트
12.9 연습문제

13. 맺음말
13.1 취직
13.2 대학원 진학
13.3 전문적 컨설팅 서비스

14. 참고문헌

 찾아보기
닫기