일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 자연어 전처리
- 출력층
- 과적합
- 성능 최적화
- 양방향 RNN
- 합성곱층
- COLAB
- 임베딩
- 생성모델
- 딥러닝
- NLTK
- 텍스트 마이닝
- RNN
- 카운트 벡터
- 풀링층
- 합성곱 신경망
- 순환 신경망
- 클러스터링
- 프로그래머스
- 완전연결층
- 전이학습
- cnn
- KONLPY
- 망각 게이트
- 이미지 분류
- 원-핫 인코딩
- 코딩테스트
- 코랩
- 입력층
- 시계열 분석
- Today
- Total
목록임베딩 (4)
Colab으로 하루에 하나씩 딥러닝

조기 종료(Early Stopping) 뉴럴 네트워크가 과적합을 회피하는 규제 기법 매 에포크마다 테스트 데이터셋에 대한 오차가 증가하는 시점에서 훈련을 멈추도록 조정 종료 시점을 확인하기 위해 콜백(callback) 함수를 무조건 함께 사용 조기 종료 실습 ### 라이브러리 호출 from tensorflow.keras.preprocessing import sequence from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense, Dropout, Activation from tensorflow.keras.layers import Embedding from tensorflow.keras.layers imp..

한국어 임베딩 한국어도 영어와 동일하게 임베딩을 진행 한국어 임베딩 진행 코드 ### 예제를 진행할 텍스트 생성 import numpy as np from tensorflow.keras.preprocessing.text import Tokenizer from tensorflow.keras.preprocessing.sequence import pad_sequences text = """과일 가게에 사과가 많이 진열되어 있다 그녀가 나에세 사과한 후, 우리는 친해졌다 애플은 사과 모양을 로고로 사용한다\n""" ### 텍스트 토큰화 tok = Tokenizer() # Tokenizer 객체 생성 tok.fit_on_texts([text]) vocSize = len(tok.word_index) + 1 seqs..

횟수 기반 임베딩 단어가 출현한 빈도를 고려하여 임베딩하는 방법 대표적으로 카운터 벡터와 TF-IDF가 존재 카운터 벡터(Counter Vector) 문서 집합에서 단어를 토큰으로 생성하고 각 단어의 출현 빈도수를 이용하여 인코딩해서 벡터를 만드는 방법 토크나이징과 벡터화가 동시에 가능 ### 코퍼스에 카운터 벡터 적용 from sklearn.feature_extraction.text import CountVectorizer corpus = [ 'This is last chance.', 'and if you do not have this chance.', 'you will never get any chance.', 'will you do get this one?', 'please, get this cha..

임베딩(Embedding) 사람이 사용하는 언어(자연어)를 컴퓨터가 이해할 수 있는 언어(숫자) 형태인 벡터(vector)로 변환한 결과 혹은 일련의 과정 단어 및 문장 간 관련성 계산 의미적 혹은 문법적 정보의 함축 임베딩 방법에 따라 희소 표현 기반 임베딩, 횟수 기반 임베딩, 예측 기반 임베딩, 횟수/예측 기반 임베딩이 존재 희소 표현 기반 임베딩(sparse representation embedding) 대부분의 값이 0으로 채워져 있음 대표적으로 원-핫 인코딩이 있음 원-핫 인코딩(one - hot encoding) 주어진 단어 N개를 각각 N차원의 벡터로 표현하는 방식 단어가 포함되어 있는 위치에 1을 넣고 나머지에는 0 값을 채움 딕셔너리에 [apple, banana, cherry]의 값이 ..