Поиск по сообщениям в этом блоге

Loading

пятница, 18 декабря 2009 г.

По качеству поиска оригиналов страниц Yandex обошел Google


Анализатор поиска оригиналов показывает резкий скачок в сторону улучшения результатов Яндекса над результатами Google.

Отправлено пользователем Anonymous через Google Reader:

источник: Яндекс.Поиск, , дата: 17.12.09

Настоящий. Я это первый открыл вместе с Петром Ивановичем.


Добчинский



Перед поисковыми системами давно стоит проблема определения первоисточника контента в интернете. Иногда издательство выкладывает свои тексты в сеть позже, чем это делают пользователи. Бывает, что у автора контента вообще нет сайта в интернете. Всё чаще встречаются случаи автоматизированного копирования текстов с целью их размещения на спам-сайтах, созданных исключительно для манипулирования алгоритмами поисковых систем, о чём мы можем судить по жалобам в нашу службу поддержки.

Определение первоисточника текста, размещённого в сети, это сложная задача, которая ещё не решена в общем виде. Однако нам удалось построить алгоритм, который во многих случаях по косвенным признакам определяет, какая из группы страниц с одинаковым текстом является оригиналом. Этот алгоритм уже работает в российской формуле ранжирования, а через некоторое время он будет включён и для всех остальных стран.

Алгоритм ещё не обладает стопроцентными полнотой и точностью, но и мы работаем над его улучшением. Будем рады примерам некорректного ранжирования оригиналов и копий, что позволит нам быстрее повысить качество разработанного алгоритма.




Александр Шубин и команда поиска

.

Здесь вы можете: