Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- kali
- 동형암호
- NLP
- 해킹입문
- pynput
- stopword
- AI
- 15679
- Normaltic
- 노말틱
- DNS해킹
- 해킹 용어
- Private AI
- CodeTranslation
- C
- lemmatization
- CProgramming
- 비트시프트
- pos tagging
- bettercap
- MachineCode
- youtubeNormaltic
- 모두의 깃&깃허브
- 딥러닝
- DNS개념
- HEaaN
- MITM
- NLTK
- c언어
- bagofwords
Archives
- Today
- Total
목록lemmatization (1)
일단 테크블로그😊

0. NLTK란? NLTK는 자연어 처리를 위한 대표적인 파이썬 라이브러리이며, 자연어 처리 분야에서 학계와 산업 현장을 가리지 않고 널리 사용되는 인기 있는 툴킷이다. NLTK가 제공하는 대표적인 알고리즘은 다음과 같으며, 본 포스팅에서는 각각의 알고리즘에 대해 알아볼 것이다.TokenizationStopwordsPOS taggingNERStemming, Lemmatization 1. Tokenization (토큰화) 우리가 컴퓨터로 자연어를 처리하기 위해서는, 받은 문장을 일정한 단위로 나누어 분석해야 한다. 이에, 입력받은 자연어를 일정한 Chunk(덩어리)로 잘라서 처리하는 과정을 Tokenization(토큰화)라고 하며, 이 Chunk들을 Token이라고 부른다. 이 Token들은 자연어 ..
AI/NLP
2024. 4. 25. 10:52