인덱싱에 대한 개념은 상당히 중요하다!!
인덱싱에 대한 개념
인덱싱은 검색 엔진의 운영 과정에서 "정보 작성" "등록"의 역할을 하는 작업입니다. 검색 엔진은 크롤러가 수집하여온 Web 페이지의 정보를 미리 중간 처리하여, 검색 알고리즘이 사용하기 쉬운 데이터 형태로 변환한 상태로 인덱스 (데이터베이스)에 저장합니다. 따라서 인덱싱에 있어서 개별 작업 내용은 검색 엔진 데이터베이스의 특징을 결정하는 중요한 요소가되고 있습니다.
이해가 잘 안되실 수도 있다는 생각이 듭니다.
인덱싱이라는 단어를 처음 접하는 분들도 있을텐테, 먼저 검색엔진에 대한 이해를 하고난 후, 인덱싱이라는 부분에 대한 이해가 진행되어야 하지 않을까 싶습니다.
자신의 사이트가 인덱싱 되어야 검색이 됩니다. 인덱싱 되지 않았다면, 자사의 사이트는 URL을 입력하지 않으면 유저는 절대 접근 할 수 없는 사이트가 되는 것입니다. 국내 기업의 해외 홈페이지가 이런 패턴이 많은 것이 현실입니다.
실전에서의 인덱싱 활용
1) 홈페이지를 만들었는데 검색이 되는지 확인하기 위해
홈페이지를 제작했습니다. 과연 해외 검색엔진에서 검색이 되는지 확인해 볼까요?
검색이 되기 위해서는 우선 인덱싱이 되어야 합니다. 이전 검색엔진에 대한 이해 부분에서 다룬 내용입니다만, 「site:URL」이라는 검색어를 입력하면, 그 사이트의 인덱싱된 내용이 구글에 나오게 됩니다. 일단 인덱싱 되어있다면 검색은 됩니다.
하기는 당 사이트의 인덱싱 내용입니다. 총 4건의 문서가 검색되고 있습니다.
![]() |
| 구글에서 site: 을 활용한 인덱싱 현황 파악 |
2)인덱싱 되었는데 사이트가 제대로 검색이 안되요~~
그렇습니다. 인덱싱 되었다고 다 검새이 되는것은 아닙니다.
하기의 경우 한국의 95%이상의 기업에서 나타나는 문제 입니다.
인덱싱은 되는데, 검색이 안되는 경우입니다. 구글은 아주 스마트한 검색엔진이면서 최고의 검색품질을 자랑하지만 웹페이지가 제대로 인덱싱 안되게 만들어진 경우 검색은 제대로 되지 않습니다.
빨간색 : 웹페이지의 타이틀
보라색 : 웹페이지의 URL
파랑색 : 웹페이지의 디스크립션
![]() |
| 인덱싱 되었으나, 검색이 안되는 경우의 사례 |
상기의 이미지처럼 모든 웹페이지가 동일한 제목이 될 경우 검색이 잘 안되는 패턴중의 한가지 입니다.
검색이 안되는 이유
1)타이틀이 동일하다.
2)타이틀에 키워드가 없다.
3)타이틀과 인덱싱에 대한 개념에 대해 이해 부족, 검색엔진에 대한 이해 부족
그런데, 주민등록번호(보라색)은 같은데, 거기에 들어있는 내용이(사람 이름이 모두 동일 합니다.)
<한 아파트(홈페이지)안에 각기 다른 호수의 집들(웹페이지)가 있는데, 거기 살고있는 사람이 모두 똑같은 이름을 가지고 있는것이죠? > 상기의 이미지의 내용을 비유하자면 이런 격입니다. 각 페이지마다 상품이 다르고, 내용도 다른데, 제목이 모두 똑같습니다. 상식적이지 않죠!!! 제작자가 이 페이지는 이렇다 라고 타이틀에 선언해 버렸기 때문에 구글도 타이틀에 없는 웹문서 내용을 제대로 검색해 주지 못하게 됩니다.
A-사이트에 (콜라,사이다,환타,소다,맥주,......)의 페이지가 있다고하더라도, 상기처럼 모두 [콜라]라는 제목으로 되어있다면,
검색시 [콜라]라고 입력하면 어떤 웹문서를 올려줄까요? 모두가 다 콜라인데.... 운좋게 콜라페이지가 노출되면 좋겠지만, 사이다 페이지가 나온다면 유저가 들어가보고 만족 할까요? 그리고, 이런 사이트는 구글의 웹검색 품질을 심각하게 저하할 우려가 있으므로 상위 노출자체를 꺼리지 않을까요?
검색시 [콜라]라고 입력했는데 -> 검색엔진이 알아서 [사이다]페이지를 올려줄 일도 없습니다.
그러면 상기 사이트의 경우 근본적으로 무엇이 문제일까요??
검색의 기본은 [텍스트 일치]라는 부분을 인식해야 합니다.
그리고 그 검색에서의 [텍스트 일치]는 타이틀이라는 부분에서 일어납니다.
즉 인덱싱을 타이틀에 있는 키워드로 한다고 단순히 생각하셔도 좋을것 같습니다.
검색이 되려면, 인덱싱 되어야하고, 인덱싱은 키워드로 되기 때문에 타이틀에 키워드를 제대로 넣어야 한다.
검색엔진 입장에서 판단할때, 전 페이지의 내용이 동일할 경우 검색엔진 측에서는 그 페이지의 내용이 아무리 뛰어나다해도 구분 할 수 있는 능력이 없기 때문에, 결국 그 페이지는 평가절하 되어버립니다.
따라서 중요한 것은 각 페이지에 그 페이지에 해당하는 타이틀을 적어줘야 하지요. 이부분은 소스상의 타이틀을 말씀드리는 겁니다. <title> 고유한 웹페이지 제목 </title> . 이렇게 제목을 구분해 주는 것만으로도 검색엔진에게는 많은 도움이 됩니다.
※참고 - 최근에 검색 알고리즘 변동으로 구글에서 어떤 웹사이트의 전 페이지가 동일 타이틀일 경우 각페이지에 맞게 타이틀을 변경하는 방향으로 알고리즘이 변화되고 있음(구글의 타이틀 변경에 관한 컨텐츠)
Ryuhyonhee
-%EA%B2%80%EC%83%89%EC%97%94%EC%A7%84%EC%B5%9C%EC%A0%81%ED%99%94.jpg)

댓글 없음:
댓글 쓰기