프로젝트/나무위키문서추천기

나무 위키 문서 추천기

kmikey1004 2021. 9. 23. 14:09

간단하게 Doc2Vec 모델을 가지고 나무위키 문서 추천기를 제작하였습니다. 

설치 방법

Chrome 웹 스토어 - 확장 프로그램 (google.com)

 

나무위키 문서추천

Namu wiki recommendation

chrome.google.com

크롬 웹스토어에서 설치가 가능합니다!

사용법

 확장 프로그램 설치가 완료된 뒤, 나무위키에 접속하면 오른쪽 사이드바에 최근 방문 문서와 문서 추천이 추가되어 있습니다. 최근 방문 문서의 경우 사용자가 문서를 읽을시에 자동으로 추가가 되며, 초기화 버튼을 통해 기록을 삭제할 수 있습니다. 

 아무런 문서나 들어간 뒤 문서 추천의 추천 받기 버튼을 누르면 문서 추천을 받을 수 있습니다. 

문서 추천은 사용자의 컴퓨터 자원을 사용합니다. 그렇기 때문에 컴퓨터 사양에 따라 추천 시간이 오래 걸릴 수 있습니다. 

 현재는 추천이 얼마나 진행됐는지 표시가 되지않습니다. 30~60초 정도 기다리면 문서 추천바에 추천 문서들이 표시됩니다.

설정

 브라우저의 오른쪽 상단을 보시면 확장프로그램이 표시가 됩니다. '나' 라고 쓰여있는 확장프로그램을 클릭하면 추천기의 설정을 확인할 수 있습니다.

 추천에 영향을 주는 문서 수

기본적으로 추천기는 사용자가 최근에 읽은 20개의 문서를 바탕으로 문서를 추천합니다. 하지만 현재 추천 방식이 읽은 문서들의 평균 벡터를 취하기 때문에 정확도가 매우 떨어집니다. 따라서 사용자가 가장 최근 읽은 문서의 수를 제한하여 추천기의 성능을 높일 수 있습니다. 사이드에 표시되는 문서는 이 값에 상관없이 20개 표시됩니다.

 

배치 크기

 추천기는 사용자의 컴퓨터에서 돌아갑니다. 나무위키 모든 문서를 한번에 계산하기에는 많은 무리가 있기때문에 이를 작은 단위 '배치'로 묶어 계산합니다. 일반적으로 배치크기가 크면 속도가 더 빠르지만 그만큼 자원을 많이 소모하므로 본인 사양에 맞춰 적당한 크기를 사용하시는걸 추천합니다. 

 

추천 문서 수

 추천 받을 문서의 수를 제한합니다. 문서의 수가 작을수록 정확도가 높지만 Bias가 심합니다.

 

주의 사항

 현재 나무위키 추천기는 Doc2Vec으로 각 문서들을 임베딩한 값을 이용하여 사용자가 읽은 문서들의 임베딩 평균과 Cosine Similarity가 가까운 문서를 순서대로 추천합니다. 따라서 미리 임베딩되지 않은 문서들의 경우 추천이 불가하며 현재는 2021년 3월 기준의 데이터를 사용하고 있습니다. 이후에 생성된 문서는 추천에 영향을 주지않고 추천하지 않습니다.

 추천기는 사용자의 컴퓨터에서 계산됩니다. 컴퓨팅 자원을 꽤나 사용하기 때문에 여러 작업을 하고 있는 중에는 사용을 자제해주세요.

추천기의 작동 방식에 흥미가 있으신 분들은 https://github.com/WeKia/NamuWiki-recommender 를 참고해주시길 바랍니다.

 

GitHub - WeKia/NamuWiki-recommender: This is project for extension that recommends NamuWiki Documents based on users read docs

This is project for extension that recommends NamuWiki Documents based on users read docs - GitHub - WeKia/NamuWiki-recommender: This is project for extension that recommends NamuWiki Documents bas...

github.com