DIN - Deep Interest Network는 딥러닝 추천시스템에서 사용하는 유명한 모델 중 하나입니다.
DIN에 대한 구조, 학습방법, 장단점에 대해서 한번 살펴볼까요?
구조
- 입력층 : 사용자 행동로그 (예) 클릭 히스토리, 구매 이력 등
- Attention Layer : 사용자의 과거 행동 중 현재 추천 대상 아이템과 관련이 높은 항목에 가중치 부여
- Embedding Layer : 사용자와 아이템의 각 feature (나이, 카테고리 등)를 임베딩 백터로 변환
- Fully Connected Layer : Attention Mechanism으로 생성된 사용자 관심 벡터를 통해 최종 점수를 예측
- 출력층 : 관심을 반영한 특징을 통해 개인화된 추천 점수를 계산
학습방법
- 목적함수 : Binary Cross Entropy (이진분류손실함수) 사용. (예) 사용자가 특정 아이템 클릭 여부, 구매여부 예측
- 데이터 구성 : 사용자 행동 히스토리 + 현재 추천 대상 아이템 조합
- 훈련기법 : 대규모 사용자 데이터와 아이템 로그를 통해 모델 학습. 미니배치 SGD (Stochastic Gradient Descent) 사용
DIN의 장단점
- 장점
- 사용자 관심사 반영 : 행동 데이터 중 현재 아이템과 관련된 관심사에 초점을 맞추기 때문에 세부적인 개인화를 가능하게 합니다.
- 경량화된 구조 : RNN 등 순환구조 없이도 높은 성능을 달성하여 연산 자원이 적게 소모됩니다.
- 단점
- 시간정보 미반영 : 사용자의 관심사가 시간에 따라 변화하는 점은 고려하지 않습니다.
- 관심사간 상호작용 부족 : 독립된 관심사만 학습하며, 각 관심사간 연결성은 모델링하지 않습니다.
다음에는 단기적인 추천에 강점을 보인 DIN에서 장기적인 관심사 추천에 포커스 한 DIEN에 대해서 설명드리도록 하겠습니다.
'Data Science > Algorithm' 카테고리의 다른 글
Optimizer (0) | 2024.11.26 |
---|---|
BERT - Bidirectional Encoder Representation from Transformers (0) | 2024.11.24 |
RoBERTa - A Robustly Optimized BERT Pretraining Approach (1) | 2024.11.23 |
LoRA (Low-Rank Adaptation) (0) | 2024.11.22 |
Sentence Transformer (0) | 2024.11.21 |
댓글