PART 01 시작하기 CHAPTER 01 비정형 데이터 = 13 1. 비정형 데이터 분석 = 14 1.1 비정형 데이터의 이해 = 14 1.2 비정형 데이터 분석과 마이닝 = 16 1.3 비정형 데이터 분석의 중요성 = 17 2. 텍스트 마이닝 = 18 2.1 텍스트 마이닝의 이해 = 18 2.2 텍스트 마이닝의 처리 과정 = 18 2.3 텍스트 마이닝의 기법 = 20 3. 소셜 데이터 마이닝 = 21 3.1 소셜 데이터 마이닝의 이해 = 21 3.2 소셜 데이터 마이닝의 활용 = 22 참고문헌 = 23 CHAPTER 02 R 시작하기 = 25 1. R 설치 및 실행 = 26 2. R스튜디오(RStudio) = 36 2.1 R스튜디오 설치 방법 = 37 2.2 R스튜디오 기본 설정 = 44 3. JAVA 설치 및 환경 변수 설정 = 48 3.1 JAVA 설치 방법 = 48 3.2 JAVA 환경 변수 설정 방법 = 53 참고문헌 = 60 PART 02 JAVA를 활용하여 크롤링하기 CHAPTER 03 이클립스와 Jsoup 설치하기 = 63 1. 이클립스(eclips) 설치하기 = 64 2. Jsoup 설치하기 = 77 CHAPTER 04 네이버 뉴스 크롤링하기 = 83 1. URL 정리하기 = 84 2. URL 연결하기 = 85 3. 네이버 뉴스 기사 본문 크롤링 = 87 4. text로 글 정제하기 = 89 5. 본문 외의 크롤링 = 90 6. Fiddler = 91 6.1 Fiddler 설치 = 91 6.2 Fiddler로 헤더 값 확인 = 95 6.3 Fiddler로 확인한 헤더정보 입력 = 96 6.4 Fiddler (결과창) = 96 7. Attr 함수 = 99 8 . 지금까지 결과(한 페이지 크롤링) = 100 10. While문 = 101 11. 지금까지 한 결과(여러 페이지 크롤링) = 103 CHAPTER 05 네이버 블로그 크롤링하기 = 105 1. 블로그 한 페이지 크롤링 = 106 2. 파싱할 사이트의 URL 입력 = 106 2.1 숨어 있는 진짜 URL 입력 = 108 2.2 숨어 있는 진짜 URL 결과 확인 = 109 2.3 URL 완성 = 110 3. 블로그 페이지 번호 = 111 3.1 블로그 페이지 번호(소스 입력) = 111 3.2 블로그 페이지 번호 = 112 3.3 블로그 페이지 번호 = 113 4. 블로그 본문 크롤링 = 115 4.1 블로그 본문 크롤링 = 115 5. 파싱할 사이트의 URL 입력 = 117 6. Fiddler로 확인한 헤더정보 입력 = 118 7. 링크 주소 확인 = 119 7.1 링크 주소 입력 = 120 8. For문 = 121 9. If문 = 122 10. 지금까지 결과 = 123 11. While문(여러 페이지) = 125 11.1 While문 시작 = 126 11.2 While문 닫기 = 126 PART 03 R을 활용하여 크롤링하기 CHAPTER 06 다음(Daum) 영화 네티즌 리뷰 = 131 CHAPTER 07 네이버(Naver) 영화 네티즌 리뷰 = 143 CHAPTER 08 트위터 크롤링 = 155 CHAPTER 09 네이버 뉴스 크롤링 = 169 PART 04 데이터 분석 및 시각화 CHAPTER 10 데이터 분석(정제) = 181 CHAPTER 11 텍스트마이닝(R 패키지 활용) = 191 1. 실습데이터 및 패키지 준비 = 192 2. 한글 사전 설정 = 197 3. 단어 추출하기 = 201 4. 단어 추출 조건 지정하기 = 202 5. 단어 추출 정제하기 = 204 6. 워드클라우드 = 205 7. 시각화 = 207 8. 연관어 분석 = 210 9. 단어 추출 및 트랜잭션 생성 = 214 10. 단어 간 연관 규칙 산출 = 216 11. 시각화 = 218 12. 단어 근접 중심성 파악 = 219 CHAPTER 12 시각화 = 223 1. Tagxdo = 224 2. Worditout = 239 3. Pajek = 248 3.1 설치하기 = 248 3.2 Pajek 간단한 네트워크 만들기 = 252 3.3 Pajek 메르스 감염경로 확인해 보기 = 260 찾아보기 = 265