소셜로그인 중단 안내

계정으로 로그인 기능이 2023년 11월 16일 중단되었습니다.

아이보스 계정이 사라지는 것은 절대 아니며, 계정의 이메일 주소를 이용해 로그인 하실 수 있습니다.

▶️ 자세한 공지사항 확인

소나 알고리즘이 대체 뭐길래?

2013.12.16 17:29

아나키

조회수 5,841

댓글 8

최근들어서 주위 사람들도 그렇고 아이보스에서도 그렇고 소나 알고리즘에 대해서 말이 많은 것 같습니다. 

그만큼 네이버의 행동 하나 하나에 사람들이 반응하고 있다는 소리기도 하겠죠? 

새로운 로직이 적용된다, 새로운 알고리즘을 적용했다. 신규 엔진이 시도될 예정이다. 

네이버의 이런 말 한 마디 한 마디가 블로그SEO나 검색 바이럴을 업으로 하고 계신 모든 분들에게 

상당히 민감하게 다가오는 것 같습니다. 

저 역시도 아이보스에서 검색바이럴에 대해서 강의를 하고 있는지라,

네이버의 이런 행보에 대해서 상당히 예의주시하고 있는 중이랍니다. 

 

그래서 오늘은 여러분들에게 소나라는 네이버의 새로운 엔진이 대체 뭐하는 녀석인지 알려드리려고 글을 씁니다. 

 

네이버의 소나 (SONAR) 뭐하는 놈일까?

기사 내용을 토대로 말씀을 드리자면 "네이버 서버에 있는 수 많은 문서들 가운데 대체 원본문서가 무엇이냐?"라는 것에 대한 알고리즘이라고 합니다. 두 개의 원본문서는 있을 수 없으며 단 하나의 문서만을 원본문서로 칭하고 이 원본문서를 재가공한 문서는 유사문서로 걸러내는 역할을 수행할 녀석이라고 합니다. 

 

과거, 프로젝트 바이오를 기억하고 계신 분들이라면 아실 겁니다. 원본문서가 있고 그 문서를 각각의 청크로 분류한 뒤 청크 단위로 매칭하여 원본문서에 가중치를 부여하고 인용문서는 가감치를 적용하여 적합한 문서를 보여주는 기술이지요. 

아마 이 소나는 프로젝트 바이오의 연장선상에 있는 알고리즘이 아닐까 생각합니다. (리브라와는 연관성이 없다고 말하기 어렵지만 리브라의 업그레이드 버전이라거나 리브라 후속 버전이라는 것에 대해서는 동의하기가 어렵네요...아예 다른 개념이니....) 

 

즉, 소나는 "불펌문서' 혹은 "유사(인용)문서"를 걸러내기 위한 알고리즘이라고 생각합니다. 

게다가 이 소나는 블로그가 아닌 웹문서에 적용이 될 것으로 생각되어지고 있는데 소나와 관련하여 네이버 신디케이션 API의 변화가 있었다고 하니, 벌써부터 블로그 윗자리노출과 소나를 연관짓는 것은 아직 시기상조가 아닐까 싶습니다. 

(심지어 네이버에서는 이런 소나를 언제 적용할 계획인지 미정이라고 밝혔기 때문에 지금 단계에서 소나를 논하는 것은 어불성설에 가깝지 않을까? 하는 생각입니다.)

 

어쨌거나, 소나라는 녀석이 어떤 식으로 문서의 중요도를 계산하는지 그 수식과 검색질의어가 들어왔을 때 해당 정보들을 어떻게 적용하는지를 나타낸 수식을 보았는데요. 중요한 부분은 역시나 모두 함수로 처리하고 있어서 알 수 없는 부분이지만 그 로직만을 두고 말하자면 다음과 같다고 할 수 있습니다. 

 

유사문서들을 수집하여 인덱싱 (직,간접적인 이용)

원본문서와 인용문서 상호간의 가중치

원본문서와 인용문서의 유사도 체크

두 문서 중 사용자의 선호도 점수 체크

문서 출처와 관련된 품질 점수 체크 

 

 

위와 같은 수식으로 점수를 매겨서 가장 높은 점수를 받은 녀석이 원본문서(상단노출이 되는)가 되는 것이죠. 

즉, 검색사용자가 어떤 질의어를 검색했을 때 그 질의어와 가장 유사한 문서들을 불러오게 되고 

이 문서들 가운데 위 점수가 가장 높게 적용이 되는 문서를 상단에 노출시켜주게 되는 것이죠. 

 

이는 구글의 페이지랭크와 개념이 상당히 유사합니다.

많이 이용되는 문서는 원본문서이기 때문에 더욱 높은 가중치를 받는 것이고 그렇지 않은 문서는 하단에 낮게 적용이 되는....

 

그럼 인용되지 않은 원본문서끼리의 경쟁이라 함은 어떨까요? 

아마 그때는 리브라라는 녀석과 다른 로직들을 통해서 스코어링되는 점수를 측정하게 되겠죠? 

(물론 웹문서와 블로그 등 모든 컬렉션에 모든 알고리즘이 적용되었다면.._)

 

지금 현 상황에서 소나라는 녀석이 적용이 되었는지, 적용되지 않았는지 알 수 없지만 아마 항간에 떠도는 것 처럼 "이미 소나가 적용되었다거나 조만간 적용될 것 같"지는 않습니다. 

아마 이런 알고리즘을 네이버가 만든다 하더라도 수 많은 변수와 버그들에 대해서 테스트를 해야 할 시간이 필요하니까요. 리브라도 지금 조금씩 다양한 키워드에 적용되고 있는데 아직 모든 키워드, 모든 컬렉션에 적용되지는 않았죠. 네이버가 "리브라를 적용합니다"라고 발표한지 1년이 넘었음에도 불구하고 아직도 일종의 "베타"기간을 거치고 있는데 소나라는 녀석이 그렇게 하루 아침에 덜컥! 하고 적용되지는 않을 것입니다. 

 

제가 오늘 이렇게 긴 글을 쓴 가장 중요한 이유는......

"소나 때문에 윗자리노출이 안되니 소나를 분석해야 한다"거나 

"소나 알고리즘이 따로 있기 때문에 그 방법을 알고 싶으면 돈을 내라"라는 등의 

허위 정보를 흘리고 다니시는 분이 있기 때문입니다. 

 

결론을 말씀드리자면 소나는 윗자리노출에 영향을 주는 녀석이라기 보다는

유사문서판독 기술에 더 가까운 녀석이라고 갈무리 지을 수 있겠습니다.

 

아직 소나는 네이버의 계획에 불과하고 실제 적용되었다 하더라도 

언제 안정화 될지 모르는 알고리즘을 파헤치기 위해서 

너무 많은 정력을 소비하지 마시기를 바랍니다. 

우리가 리브라 적용되었다고 망하지 않은 것처럼, 

프로젝트 바이오 시행되었다고 망하지 않은 것처럼,

로직 변경되었다고 망하지 않은 것처럼 

검색 알고리즘은 검색 알고리즘일 뿐입니다. 

 

보스님들, 검색 바이럴은 마케팅의 아주 작은 일부입니다. (물론 그 일부가 효과가 너무 좋긴 하지만..ㅠㅠ)

보스님들의 귀중한 시간이 헛되이 매몰되지 않았으면 하고 

우리가 진정으로 마케팅을 할 수 있고, 또 그런 마케팅에 대한 이야기가 논의되었으면 하는 바람에

글을 써보았습니다. 

 

보스님들, 네이버 정책 변경에 너무 쫄지 마세요. ^^

우리 마케팅 합시다. ㅎ

스크랩

공유하기

신고

하트 아이콘궁금너불님 외 11명이 좋아합니다.

목록글쓰기
댓글 8
댓글 새로고침

황금시간

12-184,6410

황금시간

12-183,4080

젯슷

12-185,3292

추추

12-184,142-2

두루머리

12-174,1992

앞까프리

12-175,1657

쫑알이

12-175,1930

d부엉이

12-176,1431

GoM45

12-174,6301

나봉이

12-172,6630

럭키

12-174,1800

우사랑

12-177,6593

간쥐나

12-174,3910

d부엉이

12-165,4650

아나키

12-165,84212
7

마사의길

12-164,6030

행복한하

12-163,4541

Fefalas

12-165,2930

춘천스포

12-167,0320

alls

12-155,9080

물장구

12-155,1411

물장구

12-155,6221

힘내자

12-143,5411

alls

12-146,8692

기다림

12-135,0800

별이엄마

12-137,0690

사일런트

12-136,0460

아르떼

12-135,2570

fasttree

12-134,8791

옹진

12-134,3070
목록 글쓰기
로그인 후 더욱 많은 기능을 이용하세요!아이보스 로그인