Warning: ob_start() [ref.outcontrol]: output handler 'ob_gzhandler' conflicts with 'zlib output compression' in /home/addcatn/public_html/2webmaster.net/wp-includes/functions.php on line 430
Основы работы поисковых систем | Web Master

No Comments

Основы работы поисковых систем

СЕО, Новичкам

Смысл любого сайта, это не просто его присутствие во всемирной паутине, а интерес к нему аудитории и чем больше интерес, тем лучше, иначе зачем вообще нужен сайт на который никто не заходит. Сайты ведь делают не просто для того чтобы показать другу.
Давайте рассмотрим всё на примере. Допустим имеем свежеиспеченный сайт, дизайн сайта радует глаз, удобная и интуитивно понятная навигация, а самое главное сайт содержит полезную информацию для массы людей и естественно посетителей на сайте нет.
Конечно их там и не будет, откуда же знать людям что появился новый сайт с таким то названием и доменным именем, даже если вы будете всем советовать зайти на ваш сайт, мало кто запомнит его адрес (имя и суффикс домена) и будет набирать его в адресной строке своего браузера. Большинство юзеров в сети пользуются поисковыми системами и именно оттуда идет основной поток трафика (посетителей), более того, этот трафик является наиболее таргетированным, т.е. целевым, ведь если человек искал что-то и набрал свой запрос в поисковике, то он не просто так переходит от сайта к сайту, а целенаправленно ищет именно ту информацию, которая содержится на вашем сайте.
Теперь давайте разберемся почему же ваш новоиспеченный сайт не находят поисковики, а находят тысячи других сайтов с подобной информацией, это ведь наверняка не из-за того, что на вашем сайте информация хуже чем на тысячах других подобной тематики. Разумеется для этого нужно разобраться как же работают поисковые системы.

Принцип работы поисковой системы
Алгоритм ранжирования любой поисковой системы - сложнейшая цепь всевозможных фильтров. Детальный алгоритм храниться в строжайшем секрете каждой поисковой машины и постоянно обновляется, усовершенствуется и дополняется, но наблюдения за поисковой выдачей, СЕРПом (Serch Engine Result Page) и простейшие первичные алгоритмы, которые по логике вещей должны использовать поисковые машины, позволяют сделать следующие умозаключения.

Внутренние факторы
Первым делом это само содержание сайта. Содержание (контент) это в первую очередь текстовое наполнение, ведь машины не могут расценивать и характеризовать растровые изображения. Поисковые машины используют ботов, которые шныряют по интернету, заходят на все попавшие в их поле зрения страницы и индексируют их текстовое наполнение. Например бот попал на страницу, первым делом он запомнил заголовок страницы (title), которые наиболее точно характеризует содержимое, но бот этим не ограничивается, ведь заголовок может быть одним, а содержание совсем из другой оперы, следовательно бот считывает весь текст на странице и все ссылки с этой страницы. Далее сохраненный текст разбивается на слова и исключая слова не имеющие смысла (союзы, предлоги, междометия и т.д.) запоминает количество разных слов. Считанные ссылки передаются другим ботам, по которым последние совершают те же операции и т.д., из этой схемы понятно, что работы у ботов непочатый край и они ходят по интернету на все страницы которые смогут найти по ссылкам, считывают всё содержимое и сохраняют в своей огромной базе данных. К переходам ботов по ссылкам, мы вернемся чуть позже, а сейчас рассмотрим какое содержание страниц боты считают более ревалентным тому или иному запросу. Как писалось выше, главный “показатель” содержимого страницы для ботов это заголовок страницы, далее идут заголовки абзацев разного уровня (h1, h2, h3 и т.д.) и это логично, ведь если заголовок страницы об одном, заголовки обзацев о том же, то вполне логично предположить, что текстовое содержание страницы тоже об этом. Далее идет сам текст, во первых уникальность текста, в интернете полно одинаковой информации, тогда зачем же показывать пользователям в СЕРПе одну и ту же информацию по несколько раз, такой подход поисковых систем к вопросу вполне оправдан, во вторых количество ключевых слов (фраз), которые присутствуют в поисковом запросе, но не обольщайтесь, алгоритмы поисковых машин не так примитивны и текст содержащий только ключевые слова не пройдет один из фильтров и будет засчитан за поисковый спам, не несущий полезной информации для пользователей, следовательно страница не будет показана в выдаче. В последнюю очередь это изображения, конечно не сами изображения, а подписи к ним (alt и title).

Внешние факторы
Даже если у вас сайт максимально оптимизирован под определенный запрос, т.е. запросу соответствует заголовок страницы, присутствуют заголовки абзацев разного уровня и в самом текстовом контенте плотность ключевых слов оптимальна, ваш сайт не будет найден поисковыми ботами, если на него не будет ссылаться ни один сайт, поисковик просто не будет знать о существовании вашего сайта. Допустим на ваш сайт есть одна ссылка с другого сайта, который уже известен поисковой машине и бот по ней нашел ваш сайт и благодаря ссылкам внутренней навигации проиндексировал все страницы вашего сайта. Теперь поисковая машина имеет информацию о вашем сайте и сайт можно найти в выдаче, но вряд ли поисковая машина будет показывать ваш сайт на месте выше скажем несколько сотого. Опираясь на логику вещей и алгоритмов поисковых машин, одна ссылка на сайт означает, что возможно на этом сайте имеется нужная информация, т.е. один ссылающийся сайт, не дает авторитета вашему сайту по вопросам описанным на вашем сайте. Всё логично, чем больше сайтов ссылаются на ваш сайт, тем вероятнее, что на вашем сайте авторитетная информация, следовательно в выдаче ваш сайт будет выше. Наверняка замечали, что популярные интернет ресурсы легко найти в поисковиках и сделать это легко именно по тому, что они популярны, следовательно о них много пишут в интернете и на них можно найти много ссылок с других сайтов.
Прочитав всё это не торопитесь бежать и расставлять ссылки на свой сайт где не попадя, ссылка ссылке рознь! Кроме количества ссылок, учитывается ещё и авторитетность ссылки, впервые эта технология была применена лидером среди поисковых систем, всемирной поисковой машиной - Google, подробнее об этой технологии можно прочитать в статье Растолкованный PageRank. В настоящее время, как писалось выше поисковые системы имеют разные алгоритмы ранжирования и принцип авторитетности страниц и сайтов. Вернемся к ссылкам, кроме количества ссылок, важна авторитетность ссылающихся страниц и это тоже вполне логично, т.е. если на ваш сайт ссылается 10 сайтов, авторитетность для поисковой машины которых минимальна, то ваш сайт может быть ниже в поисковой выдаче, чем сайт на который ссылается только один сайт, с большой авторитетностью и это при всех равных прочих факторов. Кроме всего прочего так же учитывается какими словами (текст в анкере ссылки alt или title баннера или кнопки) и возраст ссылки.

Прочие факторы и фильтры
Это один из самых сложных аспектов в работе алгоритмов поисковых машин, о котором можно только предполагать на основе опыта и экспериментов. Во первых это одинаковые ссылки, т.е. если некоторое количество сайтов ссылается на ваш сайт с одним и тем же текстом, то это может говорить лишь о том, что на вашем сайте действительно имеется та информация, но не говорит о разнообразии схожей информации, хуже того - черезмерное количество одинаковых ссылок может говорить о ссылочном спаме. Фильтры на ссылочный спам существуют, это факт. Бытует мнение, что есть так называемый “бонус новичка”, т.е. появляется новый сайт и он имеет некий бонус в ранжировании, т.е. при образных прочих равных, новый сайт будет выше в выдаче. Зачастую практика подтверждает такое явление, но на мой взгляд, “бонус новичка” это эффект работы нескольких фильтров. Ещё одно бытующее мнение “песок” или “песочница” (sand box), т.е. новый сайт после получения бонуса новичка, попадает в песочницу и понижается в выдаче на определенное время. Рассмотрим логику работы этих двух явлений. Например в сети появился новый сайт, это может быть сайт с анонсом какого-нибудь фильма, нового альбома музыкальной группы или ещё много чего. Зачем пользователям нужен этот сайт через продолжительное время, фишка анонса может пропасть уже через неделю когда фильм выйдет на экраны, на прилавках появятся диски с новым альбомом группы и т.д., следовательно новый сайт нужно поднять выше и показать людям. Далее, после того как бонус новичка кончается (исчезла фишка анонса), сайт попадает в песок, работа этого фильтра тоже вполне логична, интерес у публики к информации сайте пропал и его не нужно показывать в первых рядах, но эта логика на первый взгляд пропадает если речь идет не о новостных сайтах или сайтах с анонсами. На самом деле, логичнее предположить, что сайт по прежнему интересен пользователям, если прирост ссылающихся на него сайтов не прекращается, что на практике происходит только с действительно интересными и полезными ресурсами.

В этой статье я не даю четкого руководства к действию, но дал достаточно информации, чтобы понять основной алгоритм работы поисковых систем, как поднять свой сайт в поисковой выдаче и как избежать наложение понижающих фильтров. Опытные вебастера знают многое из вышеописанного и так, но у новичков после прочтения этой статьи отпадет ряд вопросов. Если вы не склонны к аналитике и не готовы к экспериментам, то никакие статьи вам не помогут, бросайте это дело и идите работать на завод, в интернете вы ничего не заработаете.

Dr @ December 9, 2007

Leave a comment

XHTML: You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>

?????? ??????????? ????????