A+ R A-

Яндекс вводит алгоритм определения оригиналов контента.

Перед поисковыми системами давно стоит проблема определения первоисточника контента в интернете. Иногда издательство выкладывает свои тексты в сеть позже, чем это делают пользователи. Бывает, что у автора контента вообще нет сайта в интернете. Всё чаще встречаются случаи автоматизированного копирования текстов с целью их размещения на спам-сайтах, созданных исключительно для манипулирования алгоритмами поисковых систем, о чём мы можем судить по жалобам в нашу службу поддержки.

Определение первоисточника текста, размещённого в сети, это сложная задача, которая ещё не решена в общем виде. Однако нам удалось построить алгоритм, который во многих случаях по косвенным признакам определяет, какая из группы страниц с одинаковым текстом является оригиналом. Этот алгоритм уже работает в российской формуле ранжирования, а через некоторое время он будет включён и для всех остальных стран.

Алгоритм ещё не обладает стопроцентными полнотой и точностью, но и мы работаем над его улучшением. Будем рады примерам некорректного ранжирования оригиналов и копий, что позволит нам быстрее повысить качество разработанного алгоритма.

http://webmaster.ya.ru

 



Добавить эту страницу в

Добавить комментарий


Защитный код Обновить

Последние комментарии