목차 일부
PART 01 시작하기
CHAPTER 01 비정형 데이터 = 13
1. 비정형 데이터 분석 = 14
1.1 비정형 데이터의 이해 = 14
1.2 비정형 데이터 분석과 마이닝 = 16
1.3 비정형 데이터 분석의 중요성 = 17
2. 텍스트 마이닝 = 18
2.1 텍스트 마이닝의 이해...
더보기
목차 전체
PART 01 시작하기
CHAPTER 01 비정형 데이터 = 13
1. 비정형 데이터 분석 = 14
1.1 비정형 데이터의 이해 = 14
1.2 비정형 데이터 분석과 마이닝 = 16
1.3 비정형 데이터 분석의 중요성 = 17
2. 텍스트 마이닝 = 18
2.1 텍스트 마이닝의 이해 = 18
2.2 텍스트 마이닝의 처리 과정 = 18
2.3 텍스트 마이닝의 기법 = 20
3. 소셜 데이터 마이닝 = 21
3.1 소셜 데이터 마이닝의 이해 = 21
3.2 소셜 데이터 마이닝의 활용 = 22
참고문헌 = 23
CHAPTER 02 R 시작하기 = 25
1. R 설치 및 실행 = 26
2. R스튜디오(RStudio) = 36
2.1 R스튜디오 설치 방법 = 37
2.2 R스튜디오 기본 설정 = 44
3. JAVA 설치 및 환경 변수 설정 = 48
3.1 JAVA 설치 방법 = 48
3.2 JAVA 환경 변수 설정 방법 = 53
참고문헌 = 60
PART 02 JAVA를 활용하여 크롤링하기
CHAPTER 03 이클립스와 Jsoup 설치하기 = 63
1. 이클립스(eclips) 설치하기 = 64
2. Jsoup 설치하기 = 77
CHAPTER 04 네이버 뉴스 크롤링하기 = 83
1. URL 정리하기 = 84
2. URL 연결하기 = 85
3. 네이버 뉴스 기사 본문 크롤링 = 87
4. text로 글 정제하기 = 89
5. 본문 외의 크롤링 = 90
6. Fiddler = 91
6.1 Fiddler 설치 = 91
6.2 Fiddler로 헤더 값 확인 = 95
6.3 Fiddler로 확인한 헤더정보 입력 = 96
6.4 Fiddler (결과창) = 96
7. Attr 함수 = 99
8 . 지금까지 결과(한 페이지 크롤링) = 100
10. While문 = 101
11. 지금까지 한 결과(여러 페이지 크롤링) = 103
CHAPTER 05 네이버 블로그 크롤링하기 = 105
1. 블로그 한 페이지 크롤링 = 106
2. 파싱할 사이트의 URL 입력 = 106
2.1 숨어 있는 진짜 URL 입력 = 108
2.2 숨어 있는 진짜 URL 결과 확인 = 109
2.3 URL 완성 = 110
3. 블로그 페이지 번호 = 111
3.1 블로그 페이지 번호(소스 입력) = 111
3.2 블로그 페이지 번호 = 112
3.3 블로그 페이지 번호 = 113
4. 블로그 본문 크롤링 = 115
4.1 블로그 본문 크롤링 = 115
5. 파싱할 사이트의 URL 입력 = 117
6. Fiddler로 확인한 헤더정보 입력 = 118
7. 링크 주소 확인 = 119
7.1 링크 주소 입력 = 120
8. For문 = 121
9. If문 = 122
10. 지금까지 결과 = 123
11. While문(여러 페이지) = 125
11.1 While문 시작 = 126
11.2 While문 닫기 = 126
PART 03 R을 활용하여 크롤링하기
CHAPTER 06 다음(Daum) 영화 네티즌 리뷰 = 131
CHAPTER 07 네이버(Naver) 영화 네티즌 리뷰 = 143
CHAPTER 08 트위터 크롤링 = 155
CHAPTER 09 네이버 뉴스 크롤링 = 169
PART 04 데이터 분석 및 시각화
CHAPTER 10 데이터 분석(정제) = 181
CHAPTER 11 텍스트마이닝(R 패키지 활용) = 191
1. 실습데이터 및 패키지 준비 = 192
2. 한글 사전 설정 = 197
3. 단어 추출하기 = 201
4. 단어 추출 조건 지정하기 = 202
5. 단어 추출 정제하기 = 204
6. 워드클라우드 = 205
7. 시각화 = 207
8. 연관어 분석 = 210
9. 단어 추출 및 트랜잭션 생성 = 214
10. 단어 간 연관 규칙 산출 = 216
11. 시각화 = 218
12. 단어 근접 중심성 파악 = 219
CHAPTER 12 시각화 = 223
1. Tagxdo = 224
2. Worditout = 239
3. Pajek = 248
3.1 설치하기 = 248
3.2 Pajek 간단한 네트워크 만들기 = 252
3.3 Pajek 메르스 감염경로 확인해 보기 = 260
찾아보기 = 265
더보기 닫기