목차 일부
옮긴이 머리말 = ⅶ
이 책에 대하여 = ⅹ
베타리더 후기 = xviii
CHAPTER 1 정돈 텍스트(깔끔한 텍스트) 형식 = 1
정돈 텍스트와 다른 데이터 구조 비교하기 = 2
unnest_tokens 함수 = 3
제인 오스틴의 작품 정돈하기 = 6
gutenbergr 패키지 = 10
단어 빈도 = 10
...
더보기
목차 전체
옮긴이 머리말 = ⅶ
이 책에 대하여 = ⅹ
베타리더 후기 = xviii
CHAPTER 1 정돈 텍스트(깔끔한 텍스트) 형식 = 1
정돈 텍스트와 다른 데이터 구조 비교하기 = 2
unnest_tokens 함수 = 3
제인 오스틴의 작품 정돈하기 = 6
gutenbergr 패키지 = 10
단어 빈도 = 10
요약 = 16
CHAPTER 2 정돈 데이터를 사용한 정서분석 = 17
정서 데이터셋 = 18
내부 조인을 사용한 정서분석 = 21
세 가지 정서 사전 비교 = 25
가장 흔한 긍정 단어와 부정 단어 = 28
워드 클라우드 = 30
단순한 단어 이상인 단위 보기 = 32
요약 = 35
CHAPTER 3 단어와 문서의 빈도 분석 : tf-idf = 37
제인 오스틴의 소설 속 용어빈도 = 38
지프의 법칙 = 40
bind_tf_idf 함수 = 44
물리학 텍스트의 말뭉치 = 47
요약 = 53
CHAPTER 4 단어 간 관계 : 엔그램과 상관 = 55
엔그램에 의한 토큰화 = 56
엔그램 개수 세기와 선별하기 = 57
바이그램 분석 = 59
정서분석 시 바이그램을 사용해 문맥 제공하기 = 62
ggraph를 사용해 바이그램 연결망 시각화화기 = 65
그 밖의 텍스트에 들어 있는 바이그램 시각화하기 = 71
widyr 패키지와 단어 쌍 세기 및 상관 = 73
각 단원 간의 개수 세기 및 상관 = 74
쌍 단위 상관 검사 = 76
요약 = 81
CHAPTER 5 비정돈 형식 간에 변환하기 = 83
문서-용어 행렬 정돈하기 = 84
DocumentTermMatrix 객체 정돈하기 = 85
dfm 객체 정돈하기 = 89
정돈 텍스트 데이터를 행렬에 캐스팅하기 = 92
Corpus 객체를 메타데이터로 정돈하기 = 94
사례 연구 : 금융 관련 기사 마이닝 = 97
요약 = 104
CHAPTER 6 토픽 모델링 = 105
잠재 디리클레 할당 = 106
단어-토픽 확률 = 108
문서-토픽 확률 = 111
예제 : 대도서관 강도 = 113
각 장의 LDA = 115
문서당 분류 = 118
단어별 할당 : augment = 121
대체 LDA 구현 = 125
요약 = 127
CHAPTER 7 사례 연구 : 트위터 아카이브 비교 = 129
데이터 및 트위터 분포 얻기 = 129
단어 빈도 = 131
단어 용도 비교 = 135
단어 사용 변화 = 137
즐겨찾기 및 리트윗 = 143
요약 = 148
CHAPTER 8 사례 연구 : NASA 메타데이터 마이닝 = 149
NASA가 데이터를 조직하는 방식 = 150
데이터 랭글링과 정돈 = 151
일부 초기 단순 탐사 = 154
단어 동시 발생과 상관 = 156
설명 및 제목 단어 연결망 = 156
중요어 연결망 = 159
설명 필드에 대한 tf-idf 계산 = 163
설명 필드 단어의 tf-idf는 무엇인가? = 163
설명 필드를 중요어에 연결하기 = 164
토픽 모델링 = 166
문서-용어 행렬에 캐스팅하기 = 166
토픽 모델링 준비 = 167
토픽 모델 해석 = 168
토픽 모델링을 중요어와 연결하기 = 175
요약 = 178
CHAPTER 9 사례 연구 : 유즈넷 텍스트 분석 = 179
전처리 = 179
텍스트 전처리 = 181
뉴스그룹의 단어들 = 183
뉴스그룹 내에서 tf-idf 찾기 = 184
토픽 모델링 = 187
정서분석 = 190
단어별 정서분석 = 191
메시지별 정서분석 = 194
엔그램 분석 = 197
요약 = 199
참고문헌 = 201
찾아보기 = 203
더보기 닫기