본문 바로가기 하단메뉴 바로가기

[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.2 영어를 위한 NLTK 2

[HD]쉽게 배우는 텍스트 마이닝(Text Mining) Part.2 영어를 위한 NLTK 2 대표 이미지
학습시간
373분 (총20강)
수료기준
진도율 100% 이상
수강대상
전 직원
좋아요
21
찜하기
0

과정소개

본 과정은 영어 텍스트마이닝을 위한 NLTK 패키지에 대한 학습과정입니다. 영어 텍스트마이닝 및 텍스트분석을 위해서는 다양한 라이브러리와 패키지들이 있는데 그중에서 가장 많이 사용되고 있는 NLTK 패키지에 기반하여 영어를 분석하고 관련된 라이브러리를 학습하는 과정입니다.

학습내용

  • 1 파이썬 코드로 n-gram 구현하기 30분
  • 2 nltk stopwords를 활용한 불용어 제거하기(1) 20분
  • 3 nltk stopwords를 활용한 불용어 제거하기(2) 16분
  • 4 nltk stopwords를 활용한 불용어 제거하기(3) - 주의사항 및 여러가지 참고사항 15분
  • 5 한국어 불용어 제거하기 11분
  • 6 Stemming(스테밍)이란 무엇이고 왜 필요한가 31분
  • 7 Stemmer를 사용한 어간 추출 27분
  • 8 PorterStemmer vs LancasterStemmer 어간 추출 비교 16분
  • 9 주어진 텍스트로 부터 Stemming 처리하기 - PorterStemmer 사용 11분
  • 10 주어진 텍스트로 부터 Stemming 처리하기 - PorterStemmer 사용 - 코드 실습 22분
  • 11 주어진 텍스트로 부터 Stemming 처리하기 - LancasterStemmer 사용 - 코드 실습 8분
  • 12 lemmatization이란 무엇이고 단어의 기본형 또는 원형복원을 하는 방법 23분
  • 13 WordNetLemmatizer를 사용하여 단어의 기본형(표제어, 원형복원) 추출하기 22분
  • 14 WordNetLemmatizer에서 제대로 처리하지 못하는 단어들 5분
  • 15 품사 정보를 제공하여 기본형(표제어) 추출 13분
  • 16 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(1) 26분
  • 17 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(2) 22분
  • 18 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(3) 30분
  • 19 정규식 토크나이저(RegexpTokenizer)를 활용한 토큰화 처리(4) 12분
  • 20 구두점 제거 및 텍스트에서 비문자 빼고 문자만 출력하기 13분

수강후기 4.8 (4개의 후기)

2025-05-11
텍스트 마이닝과 NLTK를 활용해 영어 텍스트를 직접 다뤄볼 수 있어 실무에 바로 적용할 수 있었습니다. 짧은 시간 안에 핵심 개념을 정리하고 바로 실습할 수 있어 만족스러웠습니다.
비공개
2025-02-08
텍스트 마이닝 기본을 다진 뒤 NLTK를 활용해 영어 텍스트를 직접 분석해볼 수 있어 실무에 바로 적용하기 좋았습니다. 짧은 시간에 핵심 흐름을 정리하면서도 실습 예제가 풍부해 이해가 확실히 깊어졌어요. 전체적인 구성이 알차고 유용해서 데이터 분석 업무에 큰 도움이 될 것 같습니다.
비공개
2025-01-23
텍스트 마이닝과 NLTK를 실제 영어 데이터에 바로 적용해볼 수 있어서 실무에 큰 도움이 되었습니다. 짧은 시간 안에 핵심 기능들을 정리해서 학습할 수 있어 효율적이었습니다.
비공개
2025-09-30
실습 중심으로 진행돼서 바로 영어 텍스트 분석에 적용할 수 있었고, NLTK의 기본 기능을 손쉽게 익힐 수 있었습니다. 짧은 시간 안에 핵심을 잘 정리해 줘서 실무에 바로 활용하기에 충분히 유용했습니다.
비공개