Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
Tags
- youtubeNormaltic
- 모두의 깃&깃허브
- Private AI
- 동형암호
- DNS개념
- C
- c언어
- Normaltic
- AI
- MachineCode
- NLP
- 노말틱
- kali
- stopword
- 해킹 용어
- 딥러닝
- 비트시프트
- MITM
- CodeTranslation
- pos tagging
- 15679
- lemmatization
- DNS해킹
- pynput
- CProgramming
- NLTK
- bagofwords
- bettercap
- 해킹입문
- HEaaN
Archives
- Today
- Total
목록Bow (1)
일단 테크블로그😊
0. 접근 자연어를 처리하는 방법에 대해 조금 더 생각해 보자. 이전 NLTK 포스팅(NLTK를 통한 자연어 처리 기초개념(Tokenization, Stopwords, POS tagging, NER, Stemming, Lemmatization)에서 자연어를 어떤 식으로 가공하는지 까지는 이해하였다. Token 단위로 자연어를 자르고, Stopwords들을 제거하고, Stemming이나 lemmetization을 통하여 단어를 표준화시키기는 하였지만, 이렇게 처리한 자연어는 아직 자연어이다. 즉, 숫자만 알아듣는 컴퓨터에게 이 가공된 자연어를 컴퓨터에 어떻게 변환시켜 이해시킬 것인가? 에 대한 근본적인 해답은 없는 상태이다. [AI/NLP] NLTK를 통한 자연어 처리 기초개념(Tokenization,S..
AI/NLP
2024. 4. 25. 23:34