목차
PART 01 시작하기 
  CHAPTER 01 비정형 데이터 = 13
    1. 비정형 데이터 분석 = 14
      1.1 비정형 데이터의 이해 = 14
      1.2 비정형 데이터 분석과 마이닝 = 16
      1.3 비정형 데이터 분석의 중요성 = 17
    2. 텍스트 마이닝 = 18
      2.1 텍스트 마이닝의 이해 = 18
      2.2 텍스트 마이닝의 처리 과정 = 18
      2.3 텍스트 마이닝의 기법 = 20
    3. 소셜 데이터 마이닝 = 21
      3.1 소셜 데이터 마이닝의 이해 = 21
      3.2 소셜 데이터 마이닝의 활용 = 22
    참고문헌 = 23
  CHAPTER 02 R 시작하기 = 25
    1. R 설치 및 실행 = 26
    2. R스튜디오(RStudio) = 36
      2.1 R스튜디오 설치 방법 = 37
      2.2 R스튜디오 기본 설정 = 44
    3. JAVA 설치 및 환경 변수 설정 = 48
      3.1 JAVA 설치 방법 = 48
      3.2 JAVA 환경 변수 설정 방법 = 53
    참고문헌 = 60
PART 02 JAVA를 활용하여 크롤링하기 
  CHAPTER 03 이클립스와 Jsoup 설치하기 = 63
    1. 이클립스(eclips) 설치하기 = 64
    2. Jsoup 설치하기 = 77
  CHAPTER 04 네이버 뉴스 크롤링하기 = 83
    1. URL 정리하기 = 84
    2. URL 연결하기 = 85
    3. 네이버 뉴스 기사 본문 크롤링 = 87
    4. text로 글 정제하기 = 89
    5. 본문 외의 크롤링 = 90
    6. Fiddler = 91
      6.1 Fiddler 설치 = 91
      6.2 Fiddler로 헤더 값 확인 = 95
      6.3 Fiddler로 확인한 헤더정보 입력 = 96
      6.4 Fiddler (결과창) = 96
    7. Attr 함수 = 99
    8 . 지금까지 결과(한 페이지 크롤링) = 100
    10. While문 = 101
    11. 지금까지 한 결과(여러 페이지 크롤링) = 103
  CHAPTER 05 네이버 블로그 크롤링하기 = 105
    1. 블로그 한 페이지 크롤링 = 106
    2. 파싱할 사이트의 URL 입력 = 106
      2.1 숨어 있는 진짜 URL 입력 = 108
      2.2 숨어 있는 진짜 URL 결과 확인 = 109
      2.3 URL 완성 = 110
    3. 블로그 페이지 번호 = 111
      3.1 블로그 페이지 번호(소스 입력) = 111
      3.2 블로그 페이지 번호 = 112
      3.3 블로그 페이지 번호 = 113
    4. 블로그 본문 크롤링 = 115
      4.1 블로그 본문 크롤링 = 115
    5. 파싱할 사이트의 URL 입력 = 117
    6. Fiddler로 확인한 헤더정보 입력 = 118
    7. 링크 주소 확인 = 119
      7.1 링크 주소 입력 = 120
    8. For문 = 121
    9. If문 = 122
    10. 지금까지 결과 = 123
    11. While문(여러 페이지) = 125
      11.1 While문 시작 = 126
      11.2 While문 닫기 = 126
PART 03 R을 활용하여 크롤링하기 
  CHAPTER 06 다음(Daum) 영화 네티즌 리뷰 = 131
  CHAPTER 07 네이버(Naver) 영화 네티즌 리뷰 = 143
  CHAPTER 08 트위터 크롤링 = 155
  CHAPTER 09 네이버 뉴스 크롤링 = 169
PART 04 데이터 분석 및 시각화 
  CHAPTER 10 데이터 분석(정제) = 181
  CHAPTER 11 텍스트마이닝(R 패키지 활용) = 191
    1. 실습데이터 및 패키지 준비 = 192
    2. 한글 사전 설정 = 197
    3. 단어 추출하기 = 201
    4. 단어 추출 조건 지정하기 = 202
    5. 단어 추출 정제하기 = 204
    6. 워드클라우드 = 205
    7. 시각화 = 207
    8. 연관어 분석 = 210
    9. 단어 추출 및 트랜잭션 생성 = 214
    10. 단어 간 연관 규칙 산출 = 216
    11. 시각화 = 218
    12. 단어 근접 중심성 파악 = 219
  CHAPTER 12 시각화 = 223
    1. Tagxdo = 224
    2. Worditout = 239
    3. Pajek = 248
      3.1 설치하기 = 248
      3.2 Pajek 간단한 네트워크 만들기 = 252
      3.3 Pajek 메르스 감염경로 확인해 보기 = 260
찾아보기 = 265
닫기