추천 알고리즘 종류
- 협업 필터링 (Collaborative Filtering)
- Memory-based Approach
- User-based Filtering
- Item-based Filtering - Model-based Approach
- Matrix Factorization
- Memory-based Approach
- 콘텐츠 기반 필터링 (Contents-based Filtering)
정의
- 유저-아이템 간 상호작용 데이터를 활용하는 방법
- ex) 이 영화를 좋아하는 다른 사람이 좋아하는 영화 - 콘텐츠 기반 필터링과 비교
- 정의 : 콘텐츠 특성을 기반으로 추천하는 방법
- ex) 내가 좋아하는 감동, 장르 등을 활용
특징
- 장점
- 일반적으로 Content-based보다 성능이 좋음
- 도메인에 의존되지 않음
- 쉽게(학습없이, 산술연산으로) 만들 수 있음
- 단점
- Cold start
- 새로운 유저/아이템에 대한 데이터가 적으면(sparce) 추천이 어려움
- [대안] Random, Association Rule
- Cold start
종류
User-based Filtering
- 유사한 사용자가 좋아하는 아이템을 추천
- 유저간의 유사도를 측정
- 유사도가 높은 유저가 선호하는 아이템을 추천 - 당신과 비슷한 사용자 "A"가 "B" 아이템을 좋아함
Item-based Filtering
- 아이템을 선택한 사용자들이 공통으로 좋아하는 다른 아이템을 추천
- 특정 아이템을 좋아한 사용자들을 찾음
- 이 사용자들이 공통으로 좋아하는 다른 아이템을 찾음 - 이 아이템을 좋아하는 사용자들이 "B" 아이템을 좋아함
Matrix Factorization
- 유저-아이템의 매트릭스에 비어있는(sparce) 요소를 채우는 기술
- 잠재적 특성인 Latent vector를 활용하여 Rating Matrix를 분해하고 내적값으로 추천하는 방식
- Rating Matrix : User x Item의 행렬
- Nf : Latent vector의 차원
- X : user latent factor matrix
- Y : item latent factor matrix - SVD, KNN, Deep Learning 등을 활용
https://tech.kakao.com/2021/10/18/collaborative-filtering/
https://blog.naver.com/PostView.naver?blogId=shino1025&logNo=222394488801
'데이터 엔지니어링 > 데이터 분석' 카테고리의 다른 글
[데이터분석] 정형, 비정형, 반정형 데이터 (0) | 2022.05.23 |
---|