[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.2 영어를 위한 NLTK 1

본 과정은 영어 텍스트마이닝을 위한 NLTK 패키지에 대한 학습과정입니다. 영어 텍스트마이닝 및 텍스트분석을 위해서는 다양한 라이브러리와 패키지들이 있는데 그중에서 가장 많이 사용되고 있는 NLTK 패키지에 기반하여 영어를 분석하고 관련된 라이브러리를 학습하는 과정입니다.

지금 보고있는 강의, 1년 동안 이용 가능

￦300,000

구입 문의

관리자가 본인확인을 진행한 후에 구입이 가능하므로, 문의하여 주시기 바랍니다.

1 차시
강의개요 및 권장 학습순서와 NLTK 설치하기

재생 불가(구입 필요)
2 차시
corpus(말뭉치)란 무엇인가

재생 불가(구입 필요)
3 차시
nltk gutenberg corpus 다운로드 및 텍스트 내용 출력하기

강좌 맛보기
4 차시
nltk gutenberg corpus 여러가지 값 출력

재생 불가(구입 필요)
5 차시
nltk tokenization - sent_tokenize

재생 불가(구입 필요)
6 차시
word_tokeniz() 함수를 사용한 토큰화 vs gutenberg.words() 함수를 사용한 토큰화 …

재생 불가(구입 필요)
7 차시
각 토큰당 평균 문자 수

재생 불가(구입 필요)
8 차시
브라운 코퍼스를 활용한 여러가지 메서드(1)

재생 불가(구입 필요)
9 차시
브라운 코퍼스를 활용한 여러가지 메서드(2) 및 FreqDist 함수 사용법

재생 불가(구입 필요)
10 차시
FreqDist() 함수로 단어 빈도 수 체크시 대소문자 문제

재생 불가(구입 필요)
11 차시
특정 단어의 빈도 수 체크

재생 불가(구입 필요)
12 차시
특정 단어의 빈도 수 체크 - list comprehension 사용

재생 불가(구입 필요)
13 차시
세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 기초학습

재생 불가(구입 필요)
14 차시
전부 소문자로 바꾼 후 중복되는 것 없이 단어 수 체크

재생 불가(구입 필요)
15 차시
세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 최종 통계 구하기

재생 불가(구입 필요)
16 차시
브라운 코퍼스 장르별 원하는 단어 수 세기 - ConditionalFreqDist() 사용법

재생 불가(구입 필요)
17 차시
cfd 출력시 pair로 구성해서 출력하기

재생 불가(구입 필요)
18 차시
브라운 코퍼스 카테고리별 단어 수 체크시 배열 변수 만들어서 이중 for문으로 구성하기

재생 불가(구입 필요)
19 차시
n-gram이란 무엇이고 bigram, trigram 등이 검색 예측에 어떻게 활용되어지는가

재생 불가(구입 필요)
20 차시
nltk 패키지내 ngrams를 활용하여 bigram, trigram 구하기 실습

재생 불가(구입 필요)