소셜로그인 중단 안내

계정으로 로그인 기능이 2023년 11월 16일 중단되었습니다.

아이보스 계정이 사라지는 것은 절대 아니며, 계정의 이메일 주소를 이용해 로그인 하실 수 있습니다.

▶️ 자세한 공지사항 확인

키워드 반복에 대한 개인적인 생각

2015.08.23 13:07

큰곰

조회수 2,641

댓글 1

1. 키워드가 무엇인가?

 

뭐 대충 검색어라는 것은 알고 있을 것이다. 일반적으로 명사를 많이 취급하고 명사만 키워드인 것처럼 얘기하는 경향도 있지만 사실상 사전에 나오는 모든 단어가 키워드가 된다.

 

2. 그럼 그리고/~의/./1 같은 것도 키워드가 될 수 있다는 말인가?

 

물론이다.

실제 네이버 광고관리시스템에 들어가 보면 일부 '판매가 금지된 키워드입니다' 와 같은 에러출력을 내는 것 이외 대개의 숫자라든가 특수기호도 키워드로 취급하고 있는데 여기서 나는 네이버 블로그 컨텐츠에 대해서도 꼭 그런가...아니 꼭 그럴 필요까지 있는가 하는 생각을 가끔 하고 있고 결론은 못 낸 상태이다.

 

다른 글에서 나는 우리가 어떤 포스팅을 하면 네이버 블로그의 임시서버가 이 게시물을 받고 게시물 제목에 있는 키워드를 전부 뜯어서 제목 키워드DB의 각 단어별로 올리고, 내용 역시 본문 전체의 모든 단어를 낱낱이 뜯어서 내용키워드 DB의 각 단어 항목에 올린 후 20%의 로직, 유사판정로직, 컨텐츠지수계산, 제3의 지수계산 등을 돌린 후 최종적으로 검색지수를 추출해 비로소 정식 등록되는 구조를 얘기했다.

이는 물론 내 멋대로의 상상이며 네이버가 그렇다는 말은 아니다. 나한테 시비걸고 싶거든 네이버에 물어보고 그 응답을 갖고와라

 

3. 키워드DB 라는 게 도대체 이해가 안 간다. 너님의 망상이 낳은 DB 아닌가?

 

예를 들어 지금 이 글이 사전적으로 200개의 단어로 이루어졌고 그 중 반복되어 쓰여진 것들을 1개로 취급했을 때 총 단어가 100개다...그러면

사전에 있는 모든 단어에 대한 테이블이 서버에 만들어져 있는 상태에서 그 중 100개의 테이블 마지막 줄에 내 글의 참조(뭐 고유코드화하면 더 좋겠지)가 추가된다는 뜻이다.

이 글에 있는 단어 '키워드' 라는 이름의 테이블에도 역시 내 글 '블로그에서 키워드 반복 문제에 대한 개인적인 생각' 이라는 본문 전체를 로딩할 수 있는 참조값이 쓰여진다는 말.

 

이 게시판에 지금까지 '키워드'라는 단어를 포함해 올라온 게시물이 현재 6326건이다.

만약 사용자가 저기 위에 검색창에 '키워드' 라는 단어를 입력하는 순간 이 사이트에 있는 모든 본문을 차례대로 처음부터 끝까지 검색해 키워드 가 포함되었으면 +1 씩 하면서 그 결과를 리턴한다고 생각하면 어떻겠는가? 좀 과장하면 검색 때려놓고 한 잠 자고 일어나야 한다.

그런데 6326건이란 결과가 금방 나온다는 얘기는 아이보스가 수퍼컴퓨터로 서버를 돌려서도 아니고 '키워드' 라는 테이블(이는 표현하기 쉽게 한 것이지 단어별 테이블 역시 고유코드화한다)에 '몇 줄이 있는가' 만 세면 검색결과를 유저에게 빨리 제출할 수 있다는 소리다. 이게 키워드테이블이며 이 테이블수천~수만개의 조인이 키워드DB다.

 

요즘도 보이는가 모르겠지만 몇 년 전까지 인터넷의 조그마한 게시판들을 보면 어떤 검색어를 입력하면 초기 10 페이지만 보여준 뒤 '계속검색' 버튼을 별도로 둔 거 기억할 것이다. 그런 것들이 이제 키워드DB라는 개념 없이 검색때마다 본문 전문을 다 검색하는 삽질을 반복하는 설계...당연히 서버 부하를 줄이고 응답을 빨리 하기 위해 적당한 수의 결과가 나오면 검색을 중지하고 더할래 말래...하는 구현.

 

4. 그럼 좀 과장해서 장편소설 하나를 통째로 올리면 네이버 키워드 DB는 겁나 연산이 많이 일어나겠네?  

 

그렇다.

내 소설이 하나가 22만자 정도 되니까 거기 쓰인 단어 갯수가 만약 1만개라면...10000개의 테이블에 갱신이 일어나는 작업을 네이버에 요구하는 것이다. 선량한 의미에서, 순수한 포스팅이라면 네이버도 이걸 문제삼지는 않을 것이다. 적절한 장문이 단문보다 컨텐츠의 가치가 높은 경향이 일반적으로 있으니까. 그런데 네이버는 15년 동안 수 많은 공격을 겪었을 것이다.

온갖 짜집기...사전 하나를 통째로 가져다 놓고 거기 있는 단어를 혼합하여 5만개의 테이블에 갱신이 일어나도록 만드는 DOS 어택도 겪었을 거란 말이지. DB는 갱신 순간 I/O 락이 걸리며 모든 플머와 시스템 관리자가 가장 싫어하는 부류의 요청이 DB 수정이라는 얘기를 했다.  

1메가의 사전조합 텍스트를 올려 놓고 수시로 본문을 수정해 대면, 그걸 네이버에서 제공하는 내용수정 기능이라고 아무 조치를 취하지 않는다면 어떻게 되겠나? 다른 걸 고려하지 않으면 상대적으로 적은 해킹비용으로 네이버 DB를 마비시키는 게 가능해지는 무서운 것이다...

 

5. 네이버라는 장사꾼 입장에서 키워드가 가지는 의미는 무엇인가? 

 

광고다.

또한 광고를 가능하게 하는 컨텐츠다.

광고야 검색통계에 기반을 둔 것이고 다른 이야기도 많이 있기에 접어두고 컨텐츠 얘기를 하면

 

  • 키워드로 해당 컨텐츠의 주제를 파악한다.
  • 주제파악이 가능해지는 수준 + 상위노출이 가능한 조건 + 유저반응통계가 좋은 결과 에 따라 해당 키워드에 대한 전문가 판정이 가능해진다.
  • 이 판정이 가능해지는 대상은 아주 소수일 것이나 그 대상에 포함되면 그 사람이 해당 키워드로 글을 쓸 때 일반적인 컨텐츠지수,블로그지수에 추가 알파의 지수를 더해 주는 보너스가 있을 수 있다.
  • 파워블로그가 그냥 보기에는 뭐 별 것 아닌 것처럼 보여도 네이버 설계이념 안에 이런 고민이 들어 있고 어딘가에는 일정 부분 적용되고 있다는 추측을 하게 만드는 하나의 예제이다. 그 대상이 적어서 일반인은 관찰이 안 되겠지만.
  • 나는 키워드지수가 존재하며, 광고관리에서의 키워드지수가 아니라 컨텐츠의 검색지수에도 영향을 미친다고 생각한다. 이 생각의 연장선에서 전문적인 컨텐츠를 생산할 자신만 있다면 최대한 키워드는 반복하라 는 게 내 대답이다.
  • 다만 여기에 실패할 경우 테이블 항목 자체가 별로 없는데 당신이 어떤 테이블 항목을 일정 수준이상 독차지하면...쉽게 표현해서 'DB 도배'  가 되며 각 컨텐츠의 유저반응통계가 신통치 않을 경우 추가적인 마이너스를 뚜드려 맞을 우려도 있다는 점은 함정.

 

인터넷에는 컨텐츠의 주제를 파악한다는 얘기만 할 뿐 전문가 얘기는 듣도보도 못 했을 것이다.

그 대신 '같은 키워드를 반복한 게시물이 한 블로그에 많으면 저품질 간다' 류의 소문은 어딜 가나 만날 수 있는 흔한 것들이다. 

자...쉽게 생각해보자.

내가 컴퓨터에 대한 이야기를 많이 하고 소설에 대한 얘기 음악에 대한 얘기를 많이 하듯이(여기서야 안 하지만 난 사실 블랙/데스 메탈 팬이다) 어떤 사람이 무당이라면 관상이나 굿에 대해 많은 이야기를 할 것이고, 그가 야구선수라면 야구에 대한 이야기를 많이 할 것이다.

모든 사람은 그의 삶의 기반, 생활, 그의 세계관에 대한 이야기를 하며 글로 쓸 때도 역시 마찬가지다.

무슨 얘기인지 알아들었을 것이다.

비록 블로그 컨텐츠가 개나소나 만들 수 있는 허접한 것들로 넘쳐난다는 걸 네이버도 알고 있지만 사람은 누구나 일정 분야를 맴돌 수 밖에 없으며 그 분야에 대해 오랜 기간, 많이 말하고 많이 들은 사람이 전문가로 불릴 확률이 높은 것이다. 네이버는 당신 컨텐츠를 보고 당신이 맛집에 전문가인지 원룸에 전문가인지 보험에 전문가인지 모른다. 인물검색DB 에 올라 있을 정도로 유명인이 아니라면.

즉 당신이 어떤 키워드를 자주 사용하고, 그 키워드를 사용한 컨텐츠의 유저반응통계가 좋다면...키워드 반복은 당신 지수에 +가 되었으면 되었지 절대 마이너스가 되는 로직은 없다.

하지만 현실적으로 대부분 여기에 실패하고서는 자기 컨텐츠를 연구하기 보단 네이버에서 키워드 반복으로 저품질 때리는 로직이 있다는 식으로 해석하게 되는데...

 

6. 그럼 위 말을 뒤집어 생각하면 온갖 것들에 대해 떠들어대는 잡화점 블로그는 안 좋은 것인가? 예를 들어 맛집얘기,컴퓨터 얘기,수학얘기,여행얘기,,,

 

블로그 자체가 전문 컨텐츠를 목적으로 한 것이 아니기 때문에 안 좋지는 않다. 즉 나쁘지는 않지만 좋은 것도 없다. 그게 광고든 흔히 말하는 일상이든...

즉 당신이 수천개의 게시물로 10년간 운영한 블로그가 있다 하더라도 비록 관리를 잘 해서 최적화 근처를 오르내리는 수준의 블로그지수를 가지고 있다고 하더라도 네이버에서 키워드지수에 대한 +α 를 적용받는 대상에서는 제외된다. 예를 들어 함** 블로그.

 

이상 마구 떠들어댄 키워드지수에 대한 내용은 100% 허위일 수 있으니 주의를 요합니다.

 

7. 그런 생각을 한 예를 들어달라. 인터넷에는 키워드를 반복하면 안 좋다는 얘기가 거의 정설처럼 퍼져 있다. 그리고 너님도 좀 전에 많은 경우 키워드 반복에서 실패한다고 했고...굳이 이런 말을 할 이유가 있나?

 

잘나 보이려고.

어느 글에선가 광고이면서도 저품질 맞지 않는 컨텐츠를 얘기하며 부동산 관련 키워드를 예로 든 적이 있다.

지금 당장 '원룸' 으로 검색해 보고 해당 검색결과(이는 위치정보가 있다면 지역에 따른 검색결과가 다를 수 있는 키워드다. 뭐 확인은 안 했지만 내 경우 분명한 키워드로 부동산을 검색하면 거의 대전이 포함된 업체가 1등에 뜬다. 원룸 또한....내가 대전에 살고 있기 때문일거다)에서 상위를 먹고 있는 블로그를 찾아가 보라. 대개는 검색칸이 있을 것이다. 거기서 해당 키워드를 검색해 보라...

원룸 상위노출자들은 원룸을 키워드로 포함한 글이 압도적으로 많은 경향이 있다는 걸 느낄 것이다.

 

이상하지 않나?

인터넷 이론대로라면 300개 게시물 중에서 그것도 제목에 '원룸' 을 달고 포스팅한 게 200개면 저품질 되어야 마땅한 거 아닌가? 물론 대개가 부동산 업체광고이기 때문에 본문 안에도 원룸 이란 단어가 많이 반복되었다. 그런데 상위노출?

오해하지 말 것은 부동산이 아니고 맛집 같은 경우 광고 컨텐츠를 아무리 잘 구성해도 1등 먹으면 무조건 작든 크든 마이너스를 맞기 때문에 맛집이란 키워드로는 키워드지수의 효과를 관찰하기 어렵다.

그런데 부동산은 어차피 보는 사람도 광고인 것을 알고 보며 화장실 타일 모양, 변기 상표, 벽지 색깔, 출입문 크기 등을 해당 게시물 내의 사진이나 동영상으로 확인하고 싶어 한다. 당연히 체류시간 증가...또한 업체의 광고 사진이 세밀해서 그런 것을 확인할 수 있다면 같은 업체의 다른 부동산 매물도 클릭하게 된다. 부동산 구하는 사람들은 그렇지 않나? 당연히 PV+

광고이면서도 잘만 구성하면 어떤 전문가의 컨텐츠 못지 않게 블로그지수에 + 를 주는 게 이 분야이고

여기서 키워드지수를 나는 일부 확신하게 되었다.

잘 구성된 컨텐츠는 키워드를 두고두고 우려먹어도 오히려 지수에 +α 가 되지 마이너스 때리는 로직은 앞뒤가 안 맞다. 

 

다시 말하자면 컨텐츠가 조잡해 1등 먹을시 그 스스로 마이너스 맞고 몇일 만에 밀려나는 그런 키워드로는 키워드지수를 관찰할 수 없다.

 

8. 이게 진짜가 아니길 바란다.

 

대개는 진짜가 아니라고 느낄 것이다.

앞서 말했듯 하나의 키워드로 상위 먹으면서도 마이너스 맞지 않고 탄탄한 유저통계를 쌓을 수 있는 컨텐츠를 수백개 생성할 수 있느냐...이거 어려운 일이기 때문에 엉뚱한 방향으로 시도하다 어뷰징 로직에 걸려드는 결과를 낳을 수 있다.

부정적인 예를 하나만 더 보겠다.

 

하나의 게시물 안에 키워드를 반복할 경우 네이버 로직은 해당 게시물이 관련 분야를 다룬 것으로 판단할 수 밖에 없다.

그런데 이 상태에서 그치면 네이버 블로그는 낚시터가 된다.

지금부터 하는 내 말을 네이버가 듣는다면 조만간 방법을 찾겠지만  

게시물 안에 텍스트의 길이가 매우 중요하다. 이미 일부 업자들 블로그는 이를 감지하고 짜집기 문서를 발행하고 있다.

조금 돌려서 말하면

대학교수나 방송에 나오는 강사들...그들의 컨텐츠는 어떠한가?

우선 같은 분량 안에서 구사하는 어휘가 다양하다. 말잔치로 여겨질 만큼 화려한 표현을 한다. 그런데 사람들은 이를 좋아한다.

이와는 다른 형태로 전문가들이 생산해 내는 논문이나 기술문서는 화려하진 않지만 관련 분야에서 다른 전문문서에서 언급되었던 많은 연관 단어들이 빈번하게 사용된다.

이 둘을 조합하면 키워드 반복? 한 게시물에 많이 넣을 수 있고 그러면서도 낚시나 도배로 마이너스를 맞지 않는 게 가능하다.

당신의 어휘력을 지금부터 올리기 위해 책을 읽어라~ 이런 소리는 선생들이 하는 것이지 노가다꾼인 내 주제에 맞지 않는다. 당신의 전문성을 키워라~ 물론 그런 얘기도 아니다. 어휘와 전문성은 이미 인터넷에 널렸다. 

 

이건 여기까지만. 

 

9. 키워드를 수검하는가?

 

수검 수검 하는데 그걸 리자언니가 직접 해당 블로그를 보고 '얘 이거 안 되겠네~ 마이너스 5000점!' 하는 뉘앙스라면 그런 건 거의 없다.

리자언니가 '관리자'의 애칭 같은 것이지만 대형 시스템에서는 진짜 관리자인 root/administrator 가 아니면 로직도 만질 수 없고 DB값도 수정할 수 없다. 이는 100% 그렇다.

그럼 리자언니는 뭔가?

플머들이 관리자 유틸리티를 따로 만들어 준다. 리자언니는 이 관리자화면에 접속할 권한을 갖고 있는 것이다. 즉 관리자 유틸리티가 갖고 있는 메뉴만 취급할 수 있다는 소리.

불법이나 네이버/정부협조사항 등이 아니라면 키워드에 따른 불이익은 없다고 했지만 인터넷에 흔히 있듯이 '광고키워드를 많이 올리면 저품 먹는다' 라는 소문을 그대로 적용한다 치고 예를 들어 '보험' 이란 키워드를 사용한 블로그에 대해 네이버가 통제를 한다고 치면 대체로 기존 포스팅시 있는 20% 검열로직 이외에 해당 키워드를 제제하게 된 그 원인에 따른 모듈(로직)을 별도로 만든다. (이미 만들어져 있고 소스만 일부 수정)

예를 들어 보험광고법이 바뀌었다든지....하는 경우

이 따로 만든 모듈을 가지고 보험이란 키워드테이블을 건드린 적이 있는 모든 블로그(또는 샘플조사)를 대상으로 로직을 돌린다.

네이버 자체의 정책이라면 샘플조사 정도로 그칠 수도 있지만 정부협조사항이라든가 법이 바뀌었다든가 하는 경우 전수조사가 프로그램으로 들어가고 당연히 몇 일 몇 주가 걸린다. 시스템 부하가 높은 시간에는 해당 로직을 일시정지하기도 하므로 길게는 몇 달이 걸릴 수도 있다.

이 프로그램을 돌린 결과에 대해 관리자 화면에서 승인/거부 와 같은 클릭을 하는 게 리자언니의 수검이다.

즉 해당 로직을 통과해 버리면 보험을 아무리 남발한 블로그라도 아예 리자언니가 쳐다볼 일도 없으며, 로직에 걸린 블로그라 하더라도 리자언니가 해당 블로그를 방문하여 대충 훑어보고 그냥 엔터를 누르는 게 전부지 프로그램이 제시하지도 않은 값을 리자언니가 변경할 수는 없다는 말.

 

만약 그게 가능하다면 네이버는 콩가루가 되었을 것이며 리자언니와 블로거들이 꿍짝을 해서 임의로 지수를 조절해주고 커미션을 받는 뒷거래가 매우 빈번했을 것이다. 모르겠다...있는지 없는지.

이게 가능하다면 네이버 root 는 해고해야 한다. 시스템 root 자격이 없는 설계이기 때문.

사람은 믿어야 하지만 그 사람이 불필요한 유혹에 노출되도록 방임하는 것은 믿음과는 또 다른 문제이며 어떤 인간이든 평생 자신이 가진, 이를테면 64면체 중 기껏해야 몇 개의 면만으로 자신을 정의하며,표현하며,믿으며 살아가는 존재라는 것조차 꿰뚫지 못 했다는 말이니까.

개인적으로 다면체적 인간 그 자신을 표독하게 대면하는 순간에 이르렀을 때, 그것을 나는 한 단어로 불행이라 표현한다.

이러면 좀 소설가 같냐? 

 

오늘은 여기까지...기력탕진.

 

 

 

스크랩

공유하기

신고

하트 아이콘꽁치찌개님 외 4명이 좋아합니다.

목록글쓰기
댓글 1
댓글 새로고침
1

움치움파

08.241,321
24

마음0101

08.241,459
2

홀릭s

08.241,479
8

애드랑

08.241,092
1

뿌뿌

08.241,257
5

누렁이

08.241,681
4

뽕블로그

08.241,159
2

planB

08.241,310
1

최강마케터

08.241,442
2

웨슬리

08.231,646
2

reward

08.231,149
17

bnm2800

08.231,880
51

큰곰

08.232,642
1

뽕블로그

08.23940
15

뽕블로그

08.231,403
65

큰곰

08.222,782
2

헤헤입니다

08.221,065
2

뽕블로그

08.211,096
4

AOMG

08.211,884
17

Sjy

08.213,796
5

초코초코

08.211,088
4

하얀이

08.211,407
6

대아랩탑별

08.211,620
6

초코초코

08.211,298
5

피터

08.211,351
2

랜턴죠

08.211,169
3

복덩이어머님

08.211,511
3

감자튀김

08.212,017
16

뽕블로그

08.211,189
15

logweb

08.211,541
목록 글쓰기
로그인 후 더욱 많은 기능을 이용하세요!아이보스 로그인