씨랭크, 검색 등 개인적으로 생각하는 N사 블로그 키워드 알고리즘 시스템

2017.08.07 09:44|

남자의시선|

추천48|

조회수3,658|

댓글64

안녕하세요 남자의시선입니다

 

오늘은 댓글을 달다가 이제껏 혼자만 생각해왔던 네이버 키워드 알고리즘에 대해서 한번 논해보고자 하는 생각이 들어 이렇게 글을 작성합니다

관심있는 분들은 이것을 보고 한번 유의해서 글을 작성해보시길 바랍니다

정말 재밋는 가설입니다 ^^개인적으로

 

참고로 저는 IT기업에서 종사중이며 미래를 위해 인공지능, 머신러닝, 딥러닝 알고리즘에 대해 공부하고 있는 사람임을 알아주셨으면 합니다. 개발자로써 추론할 수 있는 네이버 키워드 알고리즘에 대해서 얘기를 해볼까 합니다

(앞서 댓글을 달다가 댓글 복붙한 내용이 있을 수 있습니다)

 

네이버 블로그 시스템은 룰기반 알고리즘으로 돌아가고 있는 걸로 알고있습니다

제가 알고있는 지식을 기반으로 저는 네이버 시스템에 대해서 가설을 세웠고 실제로 이런 형태가 네이버 외의 다른 곳에서는 사용되고 있습니다
(댓글을 단 글에서 네이버 검색 봇 시스템이 3가지, 4가지 이 둘 키워드에 대한 검색이 혼동이 올수있다고 언급햇습니다)
룰기반 알고리즘에 숫자는 룰에 넣기가 힘들죠
아마 숫자 + 가지 방법 이라는 키워드상에서
컴퓨터는 숫자 + 가지 + 방법 을 인식해서
number + unit + method 로 인식 가능성이 높습니다
사막을 건너는 6가지 방법 을 예로 들어보면
사막 + 을 + 건너 + 는 + 6 + 가지 + 방법
의 의미단위로 컴퓨터는 쪼개서 인식할것이고
사막 + 을 + 건너다 + 는 + 6 + 가지 + 방법
으로 변형할 것이고
place + 조사 + 동사 + 조사 + 숫자 + 단위 + method 이렇게 갈래를 나눌 가능성이 높겠네요
(보통 룰기반 알고리즘에서는 이렇게 형태소 단위로 글을 쪼갭니다)
이때, place 카테고리를 분류하고, 동사의 카테고리를 분류하고 method의 카테고리를 분류하고
나머지는 버리게 되겠습니다 (아마 이제껏 모아둔 모든 블로그의 제목 history를 검색해서 숫자가 의미가 있을때와 없을때를 구분할 수 있을 것으로 보이긴합니다, 자연어 처리의 기본이 됩니다)
1. 건너다 (여행 카테고리 동사로 분류) -카테고리분류
2. place (지명, 위치, 타입 등을 고려하겠죠 관광지면 어느 지역으로 분류되는) - 세부 카테고리 분류
3. method (여행 카테고리 내에서 여행 팁 등으로 명명된 카테고리가 있을 수 있다는 것으로 예상해볼수있습니다)
- 세부 카테고리와 갈래가 다른 분류

이런 정보를 조합해서
이 글은 "사막 지역을 여행하는 팁이다" 라는 결과를 얻어 낼 수 있을 것입니다
(인공지능 공부를 바탕으로 추론해보았습니다. 전혀 근거 없는 얘기는 아니며, 네이버가 룰기반 알고리즘으로 돌아간다는 것은 팩트입니다

 

자 이제 이런 조합을 이용해서 어떤 식으로 일반적인 자연어처리, 인공지능, 룰기반 알고리즘 등이 적용되는지 조금 맛보기로 설명을 해보도록하죠

씨랭크도 여기에 적용이 되고 있을 가능성이 높습니다 (보상제도의 머신러닝이랄까요)

네이버는 한 아이디가 어느분야에 관심이 있는지 모두 점수로 매기고 있을 가능성이 높습니다

예를 들어 한사람이 이렇게 검색을 10가지 키워드로 했다고 가정해봅시다

 

1. 국가대표 축구경기 일정

2. 기성용 이적

3. 손흥민

4. EPL 개막 일정

5. 서울 강남 피부과

6. 서울 지하철 시간표

7. 이청용 이적 루머

8. 오늘 서울 날씨

9. 강남 맛집

10. 가평 숙소

 

자 이렇게 검색했다고 칩시다 (10개...너무 욕심부렸네요)

그럼 우리가 딱보기에 어때요?

서울 사는 사람이고, 축구에 관심이 많네? 가평놀러가려나? 지하철 자주타나봐? 피부 트러블이 생겼을까?

몇가지 추론이 되죠????

이것을 네이버 봇이 한다는 것이죠 어떻게? 룰기반 알고리즘으로!

네이버에서 단어별 카테고리를 분명 나눠놧을 겁니다 저는 확신합니다

국가대표 - 스포츠

축구경기 - 스포츠 (하위카테고리)

기성용  - 축구

손흥민 - 축구

EPL - 축구

강남 - 지명, 피부과 - 병원

등등과 같은 방법으로 말이죠!!!!!

자 그럼 분석들어갑니다 

 

1. 국가대표 축구경기 일정 - 스포츠>축구 카테고리 1점

2. 기성용 이적 - 스포츠>축구 카테고리 1점

3. 손흥민 - 스포츠>축구 카테고리 1점

4. EPL 개막 일정 - 스포츠>축구 카테고리 1점

5. 서울 강남 피부과 - 지역 > 병원 카테고리 1점

6. 서울 지하철 시간표 - 지역 > 교통 카테고리 1점

7. 이청용 이적 루머 - 스포츠>축구 카테고리 1점 

8. 오늘 서울 날씨 - 지역 > 정보 카테고리 1점

9. 강남 맛집 - 지역 > 맛집 카테고리 1점

10. 가평 숙소 - 지역 > 여행 카테고리 1점

 

자 그럼 봅시다

이 사람은 축구 5점, 병원 1점, 교통 1점, 정보 1점, 맛집 1점, 여행 1점 을 가진 사람입니다

그럼 이사람이 우리가 딱봐도 어느 분야 전문가일까요? (전문가는 관심도를 나타낸다 생각해주세요)

당연히 축구죠!

그럼 이 사람이 검색을 합니다 "손흥민 부상"

검색 결과 블로그 제목 "손흥민 부상으로 4주 결장, 시즌 초에나 복귀할 듯"

이라는 제목이 있다 가정합시다

클릭해서 들어갔죠

이렇게 축구 분야에 5점인 사람이 이 글을 들어갓습니다

그럼 해당 블로그에 C랭크 점수가 일정 올라가도록 되겠죠 (몇점일지는 모릅니다, 이 또한 체류시간, 클릭 횟수 등과 관련하여 룰이 존재할 것으로 생각이됩니다)

 

또 다른 사람이 검색을 합니다 이사람은 축구 1점, 뷰티 7점, 연예 2점을 가진 사람이라 가정합시다

한혜진 찾다가 기성용 찾은 사람일 수도 있겠군요

그럼 이사람이 축구 전문가라 말 할 수있나요? 오히려 뷰티 전문가에 가깝죠

이사람이 암만 똑같이 "손흥민 부상"이라는 단어를 검색해서

윗사람과 똑같은 글에 들어갓다 생각해봅시다

그럼 똑같은 만큼 C랭크 지수가 상승할까요?

아니라고 봅니다 절대! 왜냐면 그렇게 되면 충분한 조작이 가능합니다

네이버가 그런것을 두고 볼 리가 없습니다

아마 축구 5점 사람이 방문시 2.5점, 축구 1점 사람이 방문시 0.5점 이런식으로 씨랭크 지수가 증가될 가능성이 높습니다 (예를 든것입니다 편차가 커진채로 씨랭크 지수가 측정될 시 이또한 조작이 가능하기에 아마 점수를 log로 환산해서 아주작은 값을 만들어 더해질 가능성이 높다고 봅니다)

 

씨랭크에 대해서 제가 세운 가정의 결론은

모든 네이버 이용자가 IP마다, 아이디 마다 모두 검색정보와 조회 정보가 기록이 되어있고 점수제로 관심도를 나타내지며 관리되고있다

그래서 그 점수제가 전문가 지수를 나타낸다

이 점수를 바탕으로 해당 블로그에 들어갔을때 방문자의 전문도에 따라 씨랭크 점수가 매겨져서 블로그 점수가 올라간다

그렇게 쌓인 씨랭크 점수는 내 포스팅에 노출 랭크에 반영이 된다

 

그렇기 떄문에 블로그 마케팅시 타겟팅이 굉장히 중요하다 봐집니다

20대 여성 - 뷰티

30대 남성 - 결혼, 차, 부동산

 

뭐 이런식으로 해당 분야의 주요 타겟층을 정해서 그 타겟을 공략할 수 있는 키워드를 찾는게 좋을 것 같다는 개인적인 생각입니다 ^^(씨랭크와 지수가 빠르게 오를테니까요)

 

====================================================

이렇게 한번 정리를 해보고 싶습니다 ^^ 개인적인 생각입니다

블로그 공부와 IT 공부를 하는 사람으로써 충분히 가능성은 있다고 봐집니다만

개인의 생각에 맡기겠습니다

이견있으시면 댓글달아주시면 충분한 토론이 될 수 있을 것 같습니다 

 

=======================================================

수정

아래 댓글에 질문이 있어서 제가 작성한 답변을 첨언합니다

 

1. 이웃방문, 같은 카테고리 이웃의 방문, 검색유입
제 생각에는 블로그를 시작하는 분들은 같은 카테고리의 이웃들과 공감대 형성이 무엇보다 중요합니다
제가 작성한 글의 내용과 같이 말이죠
또한 검색방문과 이웃활동을 다른 클라스로 구분하여 점수를 매길 가능성이 있다고 생각합니다
(개발자도구를 이용해서 네이버 블로그 여러페이지를 오가며 코드를 관찰해봣는데 정확한 의미는 네이버 개발자만 알겠지만 여러가지 변수가 합해지는 그런 수식 구조를 발견했었습니다)
그래야 이웃활동에 대해서도 점수를 매길수있을것이며 이웃중에도 전문가 이웃이 이 글을 어떻게 평가하는지 네이버 봇이 판단을 내릴 수 있기 때문일 것이라 생각합니다

2. 오래 사용한 아이디
프로그래밍 적으로는 세팅이 가능하다고 봐집니다
간단히 설명을 드리자면 날짜를 점수에 반영하는 것입니다
x = 오늘날짜 (매일 바뀜)
b = 검색 당시 날짜 (고정)
x-b = 검색한지 얼마나 오래되었는가 가 숫자로 변환이 되겠죠
여기에 어떤 연산처리를 추가적으로 해주어서 그들만이 알 수 있는 점수로 환산한뒤 (1점 만점이라하면 아주 오래된 키워드에대해서는 0에 가까운 점수를 줄것이고 최근것은 1점에 가깝겟죠, 이렇게되면 편차가 아주 미비해질 것이니 제 예상에는 e^x 그래프와 직선 함수가 계단식으로 이어져있을것 같다는 생각이 드네요) 해당 분야에 대해서 아이디당 점수를 메길수있을 것이라 생각됩니다
간단하게 생각해봐도 프로그래밍적으로 셋팅이 가능 할 듯합니다

이러한 방법도 있을 것이고
다른것은 저렇게 다양한 카테고리에 점수가 평준화 되더라도 최근 검색 키워드 분야에 대한 랭킹지수가 일정 시간 단위로 업데이트 되어서 가중치로 곱해지거나 더해진다면 확실한 반영이 되지 않을까 생각됩니다
ex) 축구5점 뷰티4점 교육 5점 일때, 최근 교육을 5번 뷰티를 3번 축구를 0번 검색했다 가정합시다
이때 가중치를 (예니까 간단하게) 교육 3점, 뷰티 2점, 축구 1점 이라 줍니다
그래서 최종점수는 축구 5*1 = 5점, 뷰티 4*2=8점, 교육 5*5 = 25점 이런식으로 최근 검색패턴에 따른 카테고리 점수가 재정산 될수도 있을 것 같습니다
최근 검색한 교육이 1순위, 뷰티가 2순위, 축구가 3순위로 매겨지겠네요

3. 핸드폰 아이피
우선 네이버는 모바일 정보와 PC 정보가 따로모이죠
그래서 실험을 해봤습니다
스마트폰으로 네이버PC 화면을 검색하면 네이버 PC 검색으로 결과가 잡힙니다
구분을 m.naver.com의 유입이냐 www.naver.com의 유입이냐를 보는것이지요
그럼 이제 명확한 구분 기준이 생겼습니다 모바일과 PC를 저 두가지로 나누는 것입니다
컴퓨터는 IP가 중요하게 여겨질 수 있으나 모바일은 IP가 척도에서 배제될 방법이 생긴거겠지요
그렇다면 IP는 휴대폰은 변합니다 이것을 네이버가 어떻게 해결했을까요...?
제가 생각한바로는 단말기별 변하지 않는 맥주소 (MAC address) 입니다
아마 IP와 맥주소가 병행되어 평가반영에 사용되지 않을까 생각이 됩니다

스크랩

공유하기

신고

하트 아이콘이비님 외 47명이 추천했습니다.

 남자의시선
안녕하세요 아이보스 활동하는 남자의시선 입니다 사실 남자의시선은 제 블로그 이름이고 블로그활동 닉네임은 여행객입니다 블로그 3개째 연구중이며 2015년부터 꾸준히 연구하고 공부해왔습니다...아 사실 16년 6개월정도는 쉬었어요... 이번에 최종적으로 제나름의 방법 연구하고 블로그 개설해서 운영중입니다 지금은 잠시 쉬고 그냥 블로그에 대한 소책자 만들고있습니다
  • 활동지수7단계 (2,063점)
  •  

댓글 64
소셜로그인
번호제목작성자등록일추천조회
9990최근 포스팅 누락이 계속 발생하는데 블로그 좀 봐주세..[5] 

mintchu

17.08.112713
9989블러그 품질은 어떻게 확인가능할까요 초보질문입니다. 

피괌

17.08.100551
9988나만빼고 다아는 간단한 꿀 Tip 한가지[15] 

아맛

17.08.10242,339
9987최신순 저품질(72시간저품질)이 관련도에는 아예 안뜨는..[5] 

오도도도우도도도

17.08.100803
9986고수님들의 도움 부탁드립니다[1] 

하늘엔

17.08.100499
99853페이지 저품에서 돌아왔는데 간간히 순위노출 되네요 

비엠네트워크전건

17.08.100555
9984티스토리 블로그글 네이버 검색등록 시간 얼마나 걸리나..[10] 

스피드잡스

17.08.100666
9983홈페이지 후기 작성 후 같은 글, 같은 이미지를 블로그에.. 

햇살은가득히76

17.08.100520
9982블로그에 글을썼는데 노출이 뒤죽박죽이에요 [1] 

이비글

17.08.100645
9981인테리어 블로그 수익구조에대해 도움을 얻고자 질문드..[2] 

평범함은싫다

17.08.102502
9980 신고가 접수된 게시글입니다.[1] 

처리냠냠

17.08.10-114
9979모통저품 극복 가능할까요?ㅠㅠ[1] 

유니8484

17.08.102551
9978상위노출후 3시간후에 확인했는데 게시글이 검색되지 않..[8] 

두둥섭섭

17.08.090766
9977.[4] 

프리지

17.08.09-1681
9976블로그 조회수 순위에 같은 콘텐츠가 있다면 

JJONE

17.08.091497
9975블로그 관리 비용이 어떻게 되나요?[4] 

롑흔리나

17.08.081933
9974C랭크 이후로 원고 쓸 때[5] 

원고프로

17.08.0861,286
9973실시간 검색어 키워드 포스트 작성할경우[2] 

Arisee

17.08.080584
9972모통검에는 절대 안뜨는데 최적화 블로그일까요?[6] 

자유닝

17.08.081809
9971요즘 블로그 신고 먹히나요?....[5] 

보스가나타났오

17.08.070879
9970상위 1만등 블로그인데 키워드 마다 다른건 ..어떻게?[4] 

Iman2

17.08.071720
9969와 오늘 부로 방문자 수 쭉 떨어졌네요. [4] 

죽은영혼

17.08.070881
9968pc통검과 모통검 순위관련 문의드립니다. 도움부탁드리..[2] 

양대리

17.08.071565
996719금 키워드 마케팅은 어려울까요??[3] 

님들아알려줘

17.08.070715
9966씨랭크, 검색 등 개인적으로 생각하는 N사 블로그 키..[64] 

남자의시선

17.08.07483,659
9965키워드가 '숫자+특정단어'쓰시는분들 봐주세요[3] 

오도도도우도도도

17.08.071766
9964최신순 저품질 3주 넘게 이어지는데 해결될까요?[3] 

롱다리제이

17.08.060681
9963오래된 포스팅들[4] 

하늘엔

17.08.060579
9962요새도 방문자수가 급격히 늘어나면..[1] 

너구리방망이

17.08.050717
9961블로그 월 대행 너무 싼걸까요?[27] 

여수씨닷컴

17.08.04-22,192
첫 페이지로 이동 10 페이지로 이동 이전 페이지로 이동 11121314151617181920 다음 페이지로 이동 21 페이지로 이동 마지막 페이지로 이동
top

로그인 후 더욱 많은 기능을 이용하세요!

네이버 계정으로 로그인
페이스북 계정으로 로그인
구글 계정으로 로그인
카카오톡 계정으로 로그인
이메일 또는 아이디로 로그인
X
회원가입ID/PW 찾기 소셜 계정 로그인

전체 알림

모두 읽음 표시 알림함

받은 쪽지함

모두 읽음 표시 쪽지함