본문 바로가기 하단메뉴 바로가기

[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.2 영어를 위한 NLTK 1

[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.2 영어를 위한 NLTK 1 대표 이미지
학습시간
375분 (총20강)
수료기준
진도율 100% 이상
수강대상
전 직원
좋아요
21
찜하기
0

과정소개

본 과정은 영어 텍스트마이닝을 위한 NLTK 패키지에 대한 학습과정입니다. 영어 텍스트마이닝 및 텍스트분석을 위해서는 다양한 라이브러리와 패키지들이 있는데 그중에서 가장 많이 사용되고 있는 NLTK 패키지에 기반하여 영어를 분석하고 관련된 라이브러리를 학습하는 과정입니다.

학습내용

  • 1 강의개요 및 권장 학습순서와 NLTK 설치하기 15분
  • 2 corpus(말뭉치)란 무엇인가 12분
  • 3 nltk gutenberg corpus 다운로드 및 텍스트 내용 출력하기 21분
  • 4 nltk gutenberg corpus 여러가지 값 출력 18분
  • 5 nltk tokenization - sent_tokenize 16분
  • 6 word_tokeniz() 함수를 사용한 토큰화 vs gutenberg. words() 함수를 사용한 토큰화 비교 21분
  • 7 각 토큰당 평균 문자 수 12분
  • 8 브라운 코퍼스를 활용한 여러가지 메서드(1) 20분
  • 9 브라운 코퍼스를 활용한 여러가지 메서드(2) 및 FreqDist 함수 사용법 25분
  • 10 FreqDist() 함수로 단어 빈도 수 체크시 대소문자 문제 22분
  • 11 특정 단어의 빈도 수 체크 13분
  • 12 특정 단어의 빈도 수 체크 - list comprehension 사용 13분
  • 13 세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 기초학습 19분
  • 14 전부 소문자로 바꾼 후 중복되는 것 없이 단어 수 체크 29분
  • 15 세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 최종 통계 구하기 16분
  • 16 브라운 코퍼스 장르별 원하는 단어 수 세기 - ConditionalFreqDist() 사용법 30분
  • 17 cfd 출력시 pair로 구성해서 출력하기 12분
  • 18 브라운 코퍼스 카테고리별 단어 수 체크시 배열 변수 만들어서 이중 for문으로 구성하기 10분
  • 19 n-gram이란 무엇이고 bigram, trigram 등이 검색 예측에 어떻게 활용되어지는가 33분
  • 20 nltk 패키지내 ngrams를 활용하여 bigram, trigram 구하기 실습 18분

수강후기 4.6 (5개의 후기)

2025-10-20
실습 위주로 진행돼서 NLTK를 바로 활용할 수 있었고, 영어 텍스트 분석 기법을 체계적으로 습득할 수 있었습니다. 짧은 시간에 핵심만 짚어줘서 실제 프로젝트에 바로 적용하기에 유용했어요.
비공개
2025-09-19
텍스트 마이닝과 NLTK를 실제 코드 예제로 바로 따라 할 수 있어 바로 업무에 적용하기 좋았습니다. 영어 자연어 처리 기초를 체계적으로 정리해 주어 학습 효율이 높았습니다.
비공개
2025-07-31
실제 영어 텍스트를 바로 분석해볼 수 있어서 바로 적용하기 좋았습니다. NLTK 사용법을 단계별로 정리해 준 덕분에 복잡했던 부분도 쉽게 이해할 수 있었어요. 전체 내용이 알찬 구성이라 만족스럽습니다.
비공개
2025-06-04
영어 텍스트를 실제로 다루면서 NLTK 사용법을 익힐 수 있어 바로 실무에 적용하기에 좋았습니다. 예제 중심의 강의라 짧은 시간에 핵심 기능을 효율적으로 습득할 수 있었습니다.
비공개
2025-02-27
텍스트 마이닝 기초를 다진 뒤 NLTK를 직접 활용해 영어 텍스트를 분석할 수 있어 실무에 바로 적용하기 좋았습니다. 강의가 짧은 시간에 핵심만 압축돼 있어 효율적으로 배우기에 만족스러웠습니다.
비공개