씨랭크, 검색 등 개인적으로 생각하는 N사 블로그 키워드 알고리즘 시스템

2017.08.07 09:44|

남자의시선|

추천47|

조회수3,059|

댓글64

안녕하세요 남자의시선입니다

 

오늘은 댓글을 달다가 이제껏 혼자만 생각해왔던 네이버 키워드 알고리즘에 대해서 한번 논해보고자 하는 생각이 들어 이렇게 글을 작성합니다

관심있는 분들은 이것을 보고 한번 유의해서 글을 작성해보시길 바랍니다

정말 재밋는 가설입니다 ^^개인적으로

 

참고로 저는 IT기업에서 종사중이며 미래를 위해 인공지능, 머신러닝, 딥러닝 알고리즘에 대해 공부하고 있는 사람임을 알아주셨으면 합니다. 개발자로써 추론할 수 있는 네이버 키워드 알고리즘에 대해서 얘기를 해볼까 합니다

(앞서 댓글을 달다가 댓글 복붙한 내용이 있을 수 있습니다)

 

네이버 블로그 시스템은 룰기반 알고리즘으로 돌아가고 있는 걸로 알고있습니다

제가 알고있는 지식을 기반으로 저는 네이버 시스템에 대해서 가설을 세웠고 실제로 이런 형태가 네이버 외의 다른 곳에서는 사용되고 있습니다
(댓글을 단 글에서 네이버 검색 봇 시스템이 3가지, 4가지 이 둘 키워드에 대한 검색이 혼동이 올수있다고 언급햇습니다)
룰기반 알고리즘에 숫자는 룰에 넣기가 힘들죠
아마 숫자 + 가지 방법 이라는 키워드상에서
컴퓨터는 숫자 + 가지 + 방법 을 인식해서
number + unit + method 로 인식 가능성이 높습니다
사막을 건너는 6가지 방법 을 예로 들어보면
사막 + 을 + 건너 + 는 + 6 + 가지 + 방법
의 의미단위로 컴퓨터는 쪼개서 인식할것이고
사막 + 을 + 건너다 + 는 + 6 + 가지 + 방법
으로 변형할 것이고
place + 조사 + 동사 + 조사 + 숫자 + 단위 + method 이렇게 갈래를 나눌 가능성이 높겠네요
(보통 룰기반 알고리즘에서는 이렇게 형태소 단위로 글을 쪼갭니다)
이때, place 카테고리를 분류하고, 동사의 카테고리를 분류하고 method의 카테고리를 분류하고
나머지는 버리게 되겠습니다 (아마 이제껏 모아둔 모든 블로그의 제목 history를 검색해서 숫자가 의미가 있을때와 없을때를 구분할 수 있을 것으로 보이긴합니다, 자연어 처리의 기본이 됩니다)
1. 건너다 (여행 카테고리 동사로 분류) -카테고리분류
2. place (지명, 위치, 타입 등을 고려하겠죠 관광지면 어느 지역으로 분류되는) - 세부 카테고리 분류
3. method (여행 카테고리 내에서 여행 팁 등으로 명명된 카테고리가 있을 수 있다는 것으로 예상해볼수있습니다)
- 세부 카테고리와 갈래가 다른 분류

이런 정보를 조합해서
이 글은 "사막 지역을 여행하는 팁이다" 라는 결과를 얻어 낼 수 있을 것입니다
(인공지능 공부를 바탕으로 추론해보았습니다. 전혀 근거 없는 얘기는 아니며, 네이버가 룰기반 알고리즘으로 돌아간다는 것은 팩트입니다

 

자 이제 이런 조합을 이용해서 어떤 식으로 일반적인 자연어처리, 인공지능, 룰기반 알고리즘 등이 적용되는지 조금 맛보기로 설명을 해보도록하죠

씨랭크도 여기에 적용이 되고 있을 가능성이 높습니다 (보상제도의 머신러닝이랄까요)

네이버는 한 아이디가 어느분야에 관심이 있는지 모두 점수로 매기고 있을 가능성이 높습니다

예를 들어 한사람이 이렇게 검색을 10가지 키워드로 했다고 가정해봅시다

 

1. 국가대표 축구경기 일정

2. 기성용 이적

3. 손흥민

4. EPL 개막 일정

5. 서울 강남 피부과

6. 서울 지하철 시간표

7. 이청용 이적 루머

8. 오늘 서울 날씨

9. 강남 맛집

10. 가평 숙소

 

자 이렇게 검색했다고 칩시다 (10개...너무 욕심부렸네요)

그럼 우리가 딱보기에 어때요?

서울 사는 사람이고, 축구에 관심이 많네? 가평놀러가려나? 지하철 자주타나봐? 피부 트러블이 생겼을까?

몇가지 추론이 되죠????

이것을 네이버 봇이 한다는 것이죠 어떻게? 룰기반 알고리즘으로!

네이버에서 단어별 카테고리를 분명 나눠놧을 겁니다 저는 확신합니다

국가대표 - 스포츠

축구경기 - 스포츠 (하위카테고리)

기성용  - 축구

손흥민 - 축구

EPL - 축구

강남 - 지명, 피부과 - 병원

등등과 같은 방법으로 말이죠!!!!!

자 그럼 분석들어갑니다 

 

1. 국가대표 축구경기 일정 - 스포츠>축구 카테고리 1점

2. 기성용 이적 - 스포츠>축구 카테고리 1점

3. 손흥민 - 스포츠>축구 카테고리 1점

4. EPL 개막 일정 - 스포츠>축구 카테고리 1점

5. 서울 강남 피부과 - 지역 > 병원 카테고리 1점

6. 서울 지하철 시간표 - 지역 > 교통 카테고리 1점

7. 이청용 이적 루머 - 스포츠>축구 카테고리 1점 

8. 오늘 서울 날씨 - 지역 > 정보 카테고리 1점

9. 강남 맛집 - 지역 > 맛집 카테고리 1점

10. 가평 숙소 - 지역 > 여행 카테고리 1점

 

자 그럼 봅시다

이 사람은 축구 5점, 병원 1점, 교통 1점, 정보 1점, 맛집 1점, 여행 1점 을 가진 사람입니다

그럼 이사람이 우리가 딱봐도 어느 분야 전문가일까요? (전문가는 관심도를 나타낸다 생각해주세요)

당연히 축구죠!

그럼 이 사람이 검색을 합니다 "손흥민 부상"

검색 결과 블로그 제목 "손흥민 부상으로 4주 결장, 시즌 초에나 복귀할 듯"

이라는 제목이 있다 가정합시다

클릭해서 들어갔죠

이렇게 축구 분야에 5점인 사람이 이 글을 들어갓습니다

그럼 해당 블로그에 C랭크 점수가 일정 올라가도록 되겠죠 (몇점일지는 모릅니다, 이 또한 체류시간, 클릭 횟수 등과 관련하여 룰이 존재할 것으로 생각이됩니다)

 

또 다른 사람이 검색을 합니다 이사람은 축구 1점, 뷰티 7점, 연예 2점을 가진 사람이라 가정합시다

한혜진 찾다가 기성용 찾은 사람일 수도 있겠군요

그럼 이사람이 축구 전문가라 말 할 수있나요? 오히려 뷰티 전문가에 가깝죠

이사람이 암만 똑같이 "손흥민 부상"이라는 단어를 검색해서

윗사람과 똑같은 글에 들어갓다 생각해봅시다

그럼 똑같은 만큼 C랭크 지수가 상승할까요?

아니라고 봅니다 절대! 왜냐면 그렇게 되면 충분한 조작이 가능합니다

네이버가 그런것을 두고 볼 리가 없습니다

아마 축구 5점 사람이 방문시 2.5점, 축구 1점 사람이 방문시 0.5점 이런식으로 씨랭크 지수가 증가될 가능성이 높습니다 (예를 든것입니다 편차가 커진채로 씨랭크 지수가 측정될 시 이또한 조작이 가능하기에 아마 점수를 log로 환산해서 아주작은 값을 만들어 더해질 가능성이 높다고 봅니다)

 

씨랭크에 대해서 제가 세운 가정의 결론은

모든 네이버 이용자가 IP마다, 아이디 마다 모두 검색정보와 조회 정보가 기록이 되어있고 점수제로 관심도를 나타내지며 관리되고있다

그래서 그 점수제가 전문가 지수를 나타낸다

이 점수를 바탕으로 해당 블로그에 들어갔을때 방문자의 전문도에 따라 씨랭크 점수가 매겨져서 블로그 점수가 올라간다

그렇게 쌓인 씨랭크 점수는 내 포스팅에 노출 랭크에 반영이 된다

 

그렇기 떄문에 블로그 마케팅시 타겟팅이 굉장히 중요하다 봐집니다

20대 여성 - 뷰티

30대 남성 - 결혼, 차, 부동산

 

뭐 이런식으로 해당 분야의 주요 타겟층을 정해서 그 타겟을 공략할 수 있는 키워드를 찾는게 좋을 것 같다는 개인적인 생각입니다 ^^(씨랭크와 지수가 빠르게 오를테니까요)

 

====================================================

이렇게 한번 정리를 해보고 싶습니다 ^^ 개인적인 생각입니다

블로그 공부와 IT 공부를 하는 사람으로써 충분히 가능성은 있다고 봐집니다만

개인의 생각에 맡기겠습니다

이견있으시면 댓글달아주시면 충분한 토론이 될 수 있을 것 같습니다 

 

=======================================================

수정

아래 댓글에 질문이 있어서 제가 작성한 답변을 첨언합니다

 

1. 이웃방문, 같은 카테고리 이웃의 방문, 검색유입
제 생각에는 블로그를 시작하는 분들은 같은 카테고리의 이웃들과 공감대 형성이 무엇보다 중요합니다
제가 작성한 글의 내용과 같이 말이죠
또한 검색방문과 이웃활동을 다른 클라스로 구분하여 점수를 매길 가능성이 있다고 생각합니다
(개발자도구를 이용해서 네이버 블로그 여러페이지를 오가며 코드를 관찰해봣는데 정확한 의미는 네이버 개발자만 알겠지만 여러가지 변수가 합해지는 그런 수식 구조를 발견했었습니다)
그래야 이웃활동에 대해서도 점수를 매길수있을것이며 이웃중에도 전문가 이웃이 이 글을 어떻게 평가하는지 네이버 봇이 판단을 내릴 수 있기 때문일 것이라 생각합니다

2. 오래 사용한 아이디
프로그래밍 적으로는 세팅이 가능하다고 봐집니다
간단히 설명을 드리자면 날짜를 점수에 반영하는 것입니다
x = 오늘날짜 (매일 바뀜)
b = 검색 당시 날짜 (고정)
x-b = 검색한지 얼마나 오래되었는가 가 숫자로 변환이 되겠죠
여기에 어떤 연산처리를 추가적으로 해주어서 그들만이 알 수 있는 점수로 환산한뒤 (1점 만점이라하면 아주 오래된 키워드에대해서는 0에 가까운 점수를 줄것이고 최근것은 1점에 가깝겟죠, 이렇게되면 편차가 아주 미비해질 것이니 제 예상에는 e^x 그래프와 직선 함수가 계단식으로 이어져있을것 같다는 생각이 드네요) 해당 분야에 대해서 아이디당 점수를 메길수있을 것이라 생각됩니다
간단하게 생각해봐도 프로그래밍적으로 셋팅이 가능 할 듯합니다

이러한 방법도 있을 것이고
다른것은 저렇게 다양한 카테고리에 점수가 평준화 되더라도 최근 검색 키워드 분야에 대한 랭킹지수가 일정 시간 단위로 업데이트 되어서 가중치로 곱해지거나 더해진다면 확실한 반영이 되지 않을까 생각됩니다
ex) 축구5점 뷰티4점 교육 5점 일때, 최근 교육을 5번 뷰티를 3번 축구를 0번 검색했다 가정합시다
이때 가중치를 (예니까 간단하게) 교육 3점, 뷰티 2점, 축구 1점 이라 줍니다
그래서 최종점수는 축구 5*1 = 5점, 뷰티 4*2=8점, 교육 5*5 = 25점 이런식으로 최근 검색패턴에 따른 카테고리 점수가 재정산 될수도 있을 것 같습니다
최근 검색한 교육이 1순위, 뷰티가 2순위, 축구가 3순위로 매겨지겠네요

3. 핸드폰 아이피
우선 네이버는 모바일 정보와 PC 정보가 따로모이죠
그래서 실험을 해봤습니다
스마트폰으로 네이버PC 화면을 검색하면 네이버 PC 검색으로 결과가 잡힙니다
구분을 m.naver.com의 유입이냐 www.naver.com의 유입이냐를 보는것이지요
그럼 이제 명확한 구분 기준이 생겼습니다 모바일과 PC를 저 두가지로 나누는 것입니다
컴퓨터는 IP가 중요하게 여겨질 수 있으나 모바일은 IP가 척도에서 배제될 방법이 생긴거겠지요
그렇다면 IP는 휴대폰은 변합니다 이것을 네이버가 어떻게 해결했을까요...?
제가 생각한바로는 단말기별 변하지 않는 맥주소 (MAC address) 입니다
아마 IP와 맥주소가 병행되어 평가반영에 사용되지 않을까 생각이 됩니다

스크랩

공유하기

신고

하트 아이콘아바타아님 외 46명이 추천했습니다.

 남자의시선
안녕하세요 아이보스 활동하는 남자의시선 입니다 사실 남자의시선은 제 블로그 이름이고 블로그활동 닉네임은 여행객입니다 블로그 3개째 연구중이며 2015년부터 꾸준히 연구하고 공부해왔습니다...아 사실 16년 6개월정도는 쉬었어요... 이번에 최종적으로 제나름의 방법 연구하고 블로그 개설해서 운영중입니다 지금은 잠시 쉬고 그냥 블로그에 대한 소책자 만들고있습니다
  • 활동지수7단계 (1,983점)
  •  

댓글 64
소셜로그인
번호제목작성자등록일추천조회
28558와 오늘 부로 방문자 수 쭉 떨어졌네요. [4] 

죽은영혼

17.08.070567
28557pc통검과 모통검 순위관련 문의드립니다. 도움부탁드리..[2] 

양대리

17.08.071279
2855419금 키워드 마케팅은 어려울까요??[3] 

님들아알려줘

17.08.070395
28550씨랭크, 검색 등 개인적으로 생각하는 N사 블로그 키..[64] 

남자의시선

17.08.07473,060
28547키워드가 '숫자+특정단어'쓰시는분들 봐주세요[3] 

오도도도우도도도

17.08.071446
28545최신순 저품질 3주 넘게 이어지는데 해결될까요?[1] 

롱다리제이

17.08.060346
28544오래된 포스팅들[4] 

하늘엔

17.08.060257
28534요새도 방문자수가 급격히 늘어나면..[1] 

너구리방망이

17.08.050408
28533블로그 월 대행 너무 싼걸까요?[27] 

여수씨닷컴

17.08.04-31,777
28532와 소름이네요 ip주소때문에 저품질 ㅋㅋㅋㅋ[5] 

오도도도우도도도

17.08.0401,196
28523최신순 저품질 ㅠㅠㅠ[6] 

오도도도우도도도

17.08.040542
28518블로그 마케팅에서 이웃과의 소통은 필수이다? 아니다?[3] 

Arisee

17.08.040608
28526블로그키우기 참 힘들죠?[3] 

클래시커

17.08.030513
28504블로그 마케팅에 대해서...[1] 

패밀리

17.08.030394
28500제가 활동 잘안했는데 정확노에 노출이되네요...뭐죠?[2] 

나는야헤헤

17.08.030370
28478묵혀둔옛날아이디 새롭게 셋팅해서 시작했는데 ... 누..[9] 

여봐라

17.08.020639
28473올라갔다 떨어지는 블로그 한번만 봐주세요ㅠㅠ[11] 

살라비

17.08.020794
28462건바이건 관련해서 문의[4] 

뽀민

17.08.020561
28460블로그 진단 부탁드립니다.[1] 

예정인

17.08.020337
28453웹문서 유사 해결 방법있나요?[1] 

hidden39

17.08.010345
28447저의 블러그 한번 봐주세요 레파토리가 비슷합니다 색다..[3] 

키짱

17.08.010292
28445블로그 최신순에는 뜨는데[3] 

모르겠다모르겠어

17.08.010465
28440블로그 이웃 부탁드려요 :) 

웻지

17.08.01-3177
28437블로그 순위와 카테고리 질문있습니다![5] 

두둥섭섭

17.08.011515
28425제 블로그를 봐주시면 감사하겠습니다.[4] 

김판이여

17.08.011440
28442블로거 섭외 하는 사이트나 카페 추천 부탁드려요. 

yy030yy

17.07.31-2256
28411제 블로그좀 봐주세요..[6] 

예아

17.07.311707
28405요즘 블로그 육성..[2] 

윤사장님

17.07.310631
28403네이버 블로그인데 daum에서 주로 유입되는 이유가 궁금..[5] 

수젬

17.07.300623
28400티스토리 몇가지질문이예요[2] 

예아

17.07.300325
첫 페이지로 이동 이전 페이지로 이동 12345678910 다음 페이지로 이동 11 페이지로 이동 마지막 페이지로 이동
top

로그인 후 더욱 많은 기능을 이용하세요!

네이버 계정으로 로그인
페이스북 계정으로 로그인
구글 계정으로 로그인
카카오톡 계정으로 로그인
이메일 또는 아이디로 로그인
X
회원가입ID/PW 찾기 소셜 계정 로그인

전체 알림

모두 읽음 표시 알림함

내 댓글

전체보기

받은 쪽지함

모두 읽음 표시 쪽지함

새로운 쪽지가 없습니다.

쪽지함

스크랩함

전체보기

스크랩한 게시글이 없습니다.

아이보스 추천 게시글을 스크랩 해보세요! 스크랩하기