1. 구글 사이트에 웹 사이트 등록하기 위한 체크리스트
2. 구글에 검색시 구글 내부는 어떤 식으로 동작할까?
이런걸 왜 배워야 할까?
개발자는 웹 사이트가 멜론에 있는 인기차트라고 봐도 무방합니다.자기가 만든 사이트가 구글,네이버 등 웹 사이트에 검색 시 위에 있으면 위에 있을수록 더 좋고 사이트가 더 노출이 되고 자연스럽게 젤 처음으로 손이 가는 사이트로 될 것 입니다.그래서 이 글은 어떻게 동작하고 어떤 글이 상위에 노출이 되는지 그런 동작원리와 이유를 중점적으로 다룰 것 입니다.특히 표시된 부분부터 천천히 다룰것 입니다.

구글 사이트에 웹 사이트 등록하기 전 체크리스트
구글 검색에 동작 원리를 알기 전에 사이트가 등록이 되고 표시되기 위한 기본 체크리스트를 알고 있어야지 등록이되고 검색엔진에 한걸음 더 다가갈수 있습니다.
Google은 Google 색인에 추가할 사이트를 자동으로 찾기때문에 구글 검색결과에 표시되기위한 체크리스트를 알아야합니다.
- 웹사이트가 Google에 표시되나요?
- 사이트가 웹상의 다른 사이트에 연결되어 있지 않다.
- 사이트가 개설된 지 얼마 되지 않아 Google이 아직 크롤링하지 못한다.
- 사이트의 디자인 때문에 Google이 사이트의 콘텐츠를 효과적으로 크롤링하기 어렵다. 사이트가 HTML이 아닌 다른 전문 기술로 빌드되었다면 Google에서 올바르게 크롤링하기 어려울 수 있습니다. 사이트에 이미지나 동영상뿐 아니라 텍스트도 사용해야 함을 기억해야합니다.
- Google이 사이트를 크롤링하려는 중에 오류가 발생한다. 오류는 사이트에 로그인 페이지가 있거나 사이트에서 어떤 이유로든 Google을 차단하기 때문에 발생하는 경우가 많습니다. 시크릿 창에서 사이트에 액세스할 수 있는지 확인해야합니다.
- Google이 사이트를 발견하지 못한다.
사이트가 구글에 노출이 될려면 내 페이지의 색인이 생성되었는지 확인을 해줘야합니다.
주의할 점은 구글에서 크롤링하는 사이트가 수십억 개가 넘기때문에 발견 못하는 경우가 있을수 있습니다.
Google 크롤러가 특정 사이트를 크롤링하지 못한다면 그 이유는 주로 다음과 같습니다.
// 색인 확인 방법 site:example.com

- 사용자에게 고품질 콘텐츠를 게재하나요?
사이트에서 사용자에게 최상의 경험을 제공하는지 생각해봐야한다.seo에 맞게 잘 설계했는지,google이 선호하는 방식에 따라 관리를 했는지 스스로 생각해야합니다.
- 소유 중인 지역 비즈니스가 Google에 표시되나요?
해당 국가나 지역이 구글을 지원을 안한다면 소용이 없다.북한,중국,쿠바 등 이런 국가는 구글을 제공안하기 때문에 생각하면서 제작하면 됩니다.
- 모든 기기에서 콘텐츠에 쉽고 빠르게 액세스할 수 있나요?
pc뿐만 아니라 모바일도 최적화를 해서 빠르게 로드되고 제대로 표시되도록 노력해야한다.
- 웹사이트가 안전한가요?
- 특정 주제와 관련된 콘텐츠인가요?
구글에 검색시 구글 내부는 어떤 식으로 동작할까?
앞서 말한 걸 체크를 했다면 이제 이 내부는 어떻게 동작하는지 알아야지 어떤식으로 사이트를 구성해야하는지 알수 가 있습니다.구글 검색은 웹 크롤러라는 소프트웨어를 사용하는 완전히 자동화된 검색엔진입니다. 웹 크롤러는 정기적으로 탐색하여 구글 색인에 추가할 페이지를 찾습니다.
- 구글 검색의 3단계
- 구글 검색은 3단계로 작동하며,각 단계가 모든 페이지에 적용되는거는 아닙니다.
- 크롤링
- 느낀점
- 색인 생성
- 느낀점 이 단계에서는 주로 메타태그와 이미지,텍스트,동영상 파일 속성처리를 잘 해서 색인 생성에 핵심 정보가 포함되도록 잘 해야겠다는 걸 느꼈고 대표페이지가 어떻게 선택되는지 명확하게 안나와있어서 아쉬웠다.
- 검색결과 게재 사용자가 검색어를 입력하면 Google 컴퓨터는 색인에서 일치하는 페이지를 검색한 다음 품질이 가장 높고 사용자의 검색어와 가장 관련성이 크다고 판단되는 결과를 반환합니다.여기서 관련성은 사용자의 위치와 언어,기기와 같은 정보를 비롯하여 수많은 요인으로 결정됩니다.
- 느낀점
크롤러라는 자동화 프로그램을 사용하여 인터넷으로 찾은 페이지로부터 텍스트,이미지,동영상을 다운 받습니다.웹에서 어떤 페이지가 존재하는지 파악을 해야하기때문에 첫 번째 단계에서 크롤링을 한다.모든 페이지가 중앙 레지스트리에 있는게 아니라서 새로운 페이지와 업데이트 페이지를 검색하여 파악된 페이지 목록에 추가해야하는데 이걸
URL검색
이라고 합니다.또한 googlebot이라는 봇으로 크롤링할 사이트와 크롤링 빈도, 각 사이트에서 가져올 페이지 수를 결정합니다.크롤링 하는 동안 구글은 브라우저에게 방분 페이지를 렌더링하는 방식과 유사하게 최신 버전의 크롬을 사용하여 페이지를 렌더링하고 발견된 js를 실행합니다.왜냐하면 js를 사용하여 페이지에 콘텐츠를 표시하는 경우가 많아서 구글도 렌더링을 하지 않으면 콘텐츠를 보지 못할수 있기때문입니다.
여기서 중요한게 볼 포인트는 구글은 1단계로 웹에 어떤 페이지가 존재하는 지 파악을 하기 위해서 크롤링을 하고 url 검색과 googlebot이라는 봇으로 결정하고 크롤링하는 동안 구글은 발견된 js를 실행하는데 왜 실행되는지를 통해서 어떻게 동작하는지를 알 수 가 있었다.이런걸 내가 원하는 대로 구글이 url를 탐색할 수 있도록 할수 있게
사이트맵
을 활용하여 작업하는게 중요하다는걸 알 수 있었다.페이지 크롤링이 되면 페이지의 핵심내용을 파악하려고 하는 단계를 색인 생성이라고 합니다.이 단계에서는
<title>
요소 및 Alt 속성, 이미지, 동영상 등 텍스트 콘텐츠 및 핵심 콘텐츠 태그와 속성을 처리하고 분석하는 작업이 포함됩니다.색인 생성 프로세스 중에서 페이지가 있는지 중복이 되는지 아니면 표준 페이지 인지 판단을 합니다.표준페이지는 검색 결과에 표시될 페이지이며,이걸 정하기 위해서 비슷한 콘텐츠를 모두 그룹으로 묶고(이 과정을 클러스터링이라고 합니다.)가장 대표하는 페이지를 선택합니다.ex) ‘자전거 할인점’이라는 키워드를 홍콩에서 검색한거랑,파리에서 검색한거랑 다른 결과가 나옴니다.
ex) ‘자전거 수리점’이라는 키워드를 검색하면 이미지 검색결과가 표시되지 않지만 ‘최신 자전거’라는 키워드를 검색하면 이미지 검색결과가 표시될 가능성이 더 높습니다.
예제들을 통해서 어떤 키워드를 검색하는지에 따라서 나올수 있는 결과가 다른게 재미있고 신기했습니다.
느낀점
아직 seo에 대해서 다루지는 않았지만 구글이 검색결과가 나올때 어떤 과정으로 검색 결과가 나오는지 에 대해서 알 수 있었고 생각보다 이해하기도 힘들고 배울 내용도 많아보였지만 재미있는 경험이였고 seo를 다룰려면 이러한 과정을 알아야된다고 생각해서 배워보았습니다.