• »

Урок SEO №4_2 Математические модели поисковых систем!

Мировые поисковые системы

Я рад всех приветствовать на своих Уроках по SEO. Давайте продолжим рассматривать принцип работы поисковых систем для получения более яркого представления о направлении в оптимизации своего сайта. На прошлом занятии мы подошли к математическим моделям. Так давайте рассмотрим: "Что же такое математическая модель?"

Математическая модель - Это попытка, описать определенный процесс, действие или объект математической формулой.

Ну я думаю Все смотрели фильм "Матрица" - так вот, именно там сюжет, был построен в том стиле что, наша жизнь и наш мир это все математическая модель. А главный герой "Neo" - это ошибка закравшаяся в математическую модель мира! Это был шуточный но яркий пример математической модели.

На сегодняшний день множество компаний любой процесс, любые рутинные действия человека пытаются выразить математической формулой в виде какой то математической модели. Что это им дает? Естественно замена человека - машиной (компьютером, роботом). Мы с вами уже много раз видели по научным каналам допустим конвейер по сборке машин. Львиную долю работы в место людей делают роботы. И это все благодаря тому что человеку удалось описать рутинные процессы (которые делает человек) формулой. А имея конкретную математическую формулу мы без проблем можем внести её в компьютер и дать команду на выполнение этой математической формулы.

Поисковые системы тоже не исключение, они используют математические модели для решения двух немаловажных задач. А именно:

1. Задача. Какие документы (сайты) считать найденными, для определенного запроса. Ввел пользователь запрос "кондиционер", поисковой системе нужно выбрать из всех документов, те документы, которые будут иметь отношение к запросу "кондиционер".

2. Задача. Произвести ранжирование данных документов. Разместить найденные сайты в определенной последовательности.

С предыдущего урока мы с Вами знаем что существует всего три типа математических моделей используемых в поисковых системах.

1. Булевская математическая модель.

2. Векторная математическая модель.

3. Вероятностная математическая модель.

Давайте теперь более конкретней рассмотрим данные модели.

1. Булевская или логическая математическая модель. Данная модель очень проста и оперирует лишь двумя понятиями, а именно: "Истина (true)" или "Ложь (false)". Задал пользователь запрос "кондиционер".  Если в документе присутствует слово "кондиционер" - значит документ найден. Если не присутствует - значит документ не найден. Вот такой вот простой принцип работы данной модели.

Но есть одно но! Есть слова как в русском так и в украинском языках которые присутствуют в каждом документе, а именно это предлог "в" или союз "и" и т.д. Так вот если пользователь введет запрос с предлогом "в" поисковой системе нужно будет показать пользователю миллиарды документов, что у пользователя просто в голове не уложится как с этим всем разобраться. И вот поэтому поисковые системы используют дополнительно другие математические модели, а в частности "Векторную математическую модель", для улучшения качества поиска релевантных документов по определенному запросу. Давайте рассмотрим эту математическую модель.

2. Векторная математическая модель. Данная модель использует такое понятие как "Вес документа" по отношению к заданному запросу.

Скажем так - пользователь вбил запрос "кондиционер". Если слово кондиционер в документе встречается 10 раз, тогда этот документ более релевантен, чем документ в котором слово "кондиционер" встречается только один раз. Из этого мы выведем грубую формулу по которой считается "Вес документа".

Вес документа = TF*IDF*X где,

TF - Частота слова в документе.

IDF - редкость слова в совокупности документов, которые проиндексированы поисковой системой.

X - прочие факторы. Данные факторы мы не знаем, они хранятся в строгой секретности каждой поисковой системы.

На данный момент все поисковые системы используют данную математическую модель.

3. Вероятностная математическая модель. О данной модели расскажу вкратце, так как данная модель используется очень редко. Принцип данной модели лежит в создании эталонных документов для каждого запроса. Эталонных документов может быть несколько. К примеру: ввел пользователь запрос "кондиционер" - а в поисковой системе для данного запроса есть эталонный документ. Поисковая система выдала пользователю на первом месте эталонный документ - а далее все сайты похожие на данный эталонный документ. Это все хорошо б работало - вот только если бы пользователей интернета можно было посчитать на пальцах. А так как пользователей очень много и каждый хочет чего-то найти, данная модель просто не подходит для использования. Представьте только для каждого запроса подобрать несколько эталонных документов! Я думаю это просто не реально.

И так, подведем итог: Хочу повторно обратить Ваше внимание на векторную математическую модель - от сюда я бы вынес несколько правил.

1. Если мы составляем статью под несколько ключевых слов - эти ключевые слова обязательно должны встречаться в данной статье и не один раз. Но сразу хочу Вас предостеречь! Не нужно сильно увлекаться повторением ключевого слова в тексте, так как можно попасть в немилость поисковой системы.

2. Ключевые слова должны быть созвучны с текстом и быть одним целым.

3. И еще одно правило. Если мы написали статью о том как прекрасен сегодняшний день - не стоит вносить ключевые слова которые даже при максимальном приближении не относятся к нашей статье к примеру "Заработок в интернете" и т.д..

4. Текст статьи который мы с вами пишем должен быть уникальным. Так как если поисковая система распознает дубликат вы рискуете попасть в немилость поисковой системы что приведет к вылету из индекса. Робот поисковой системы будет реже посещать Ваш сайт, а то и вовсе может перестать заходить на него. И все старания будут без результатными.

И в завершение хочу сказать что поисковые системы могут использовать как одну математическую модель так и целый комплекс математических моделей одновременно. Что в свою очередь повышает качество работы поисковой системы.

 

.Советуем ознакомиться:

Комментариев нет :(

Добавить комментарий

Полужирный Наклонный текст Подчёркнутый текст Зачёркнутый текст | Выравнивание по левому краю По центру Выравнивание по правому краю | Вставка смайликов Выбор цвета | Скрытый текст Вставка цитаты Преобразовать выбранный текст из транслитерации в кириллицу Вставка спойлера