N 검색 기반 변화 에 따른 누락 조건
아래는 n특허문건에 공개되는 방법입니다.
형광펜은 제 사견입니다.
TF 기반 검색 방법
쿼리 텀(query term)이 문서에 많이 등장할수록 랭킹이 높아진다.
예를 들어, 쿼리 텀에 해당되는 'campaign', 'about', 'vegetarian' 단어가 문서에
많이 등장할수록 해당 문서의 랭킹이 높아진다.
예전특정글자수 특정단어 4~5회 검색노출
IDF 기반 검색 방법은
쿼리 텀을 포함하는 문서의 수가 작을수록(쿼리 텀이 유니크할수록) 랭킹이 높아진다.
예를 들어, 'vegetarian'이 등장하는 문서수가 'about'이 등장하는 문서수보다
작은 경우 'vegetarian'을 포함 한 문서가 'about'을 포함한 문서보다 랭킹이 높아진다.
DL 기반 검색 방법은
문서의 길이가 짧을수록 문서의 랭킹이 높아진다.
문서의 길이가 길어지면 자연스럽게 TF 가 높아질 수 있기 때문에
패널티(penalty)를 적용하는 방식이다.
예전방식이면 패널티가 생기는방식
흔히 격는누락은 직접경험한후기가아님으로 상투적인설명단어등
예전방식대로 포스팅하고있을확률이높습니다.
그렇기에본인도 모르게 사용하고있을 확률을 단어 분석기를통해
과하게들어간것은 덜어내고 부사형용사등 별필요없는것을 줄이면
도움이 될것이라 판단하고 글을 작성한내용입니다.
새댓글
전체보기