Search by WMSN

Представьте, что произошло чудо, вам написал Google и пригласил к себе на работу в только что основанную «дорвейную службу». Это специальная команда, которая вычищает поиск от всякого рода дорвеев. Понятно, что по одиночке искать доры крайне неэффективно. Нужно много думать, потому что дорвейщики, сука, не спят, и бьются против вас. Вы уже и сами в прошлом матерые дорвейщики, поэтому можете думать на шаг вперед. Ваше первое задание — написать максимально большой список признаков, по которым можно палить дорвей. По этим признакам будет составлена тестовая выборка из выдачи, чтобы подтвердить или опровергнуть признаки. Поехали!

Answers:

Пожалуй, сам и начну. Я бы начал рыть в текстах и доебался бы до лингвистов и программистов, чтобы понять «какими тексты быть не могут». Пример: «нормальные тексты редко заканчиваются предлогами и союзами типа «от», «об», «а», «в», «на». Соответственно нужно подкручивать анализаторы.

fabmoretti, ты почитай этот микроблог, мои записи, ошибок таких дофига, с маленькой кувы начало, без точки в конце и т.п. jkeks тоже пишет как будто это дорген ))) самый главный признак дора - это свежерег, на котором за месяц появилась тыща страниц, сразу с вероятностью 99% можно банить, потому что это дор.

Да, Джикекс живой пример дорвея. )))

Mik Foxi, это спорно. я основал сайт знакомств, пульнул миллион долларов на маркетинг, пришло кучу народу, куча рег, вот тебе миллион страниц за месяц. дор? технически - да, по сути - нет. дор - это всегда сочетание факторов.

fabmoretti, так нах тебе тогда гугл?

Papaul, это пример. лучше бы умное что-нибудь написал

Смотрите лекции по устройству поисковых систем. habrahabr.ru Все не много проще.

а так фильтр может быть такой: 1) свеже рег; 2) много новых страниц; 3) структура punbb? 4) средний размер страницы 300-500 символов = бан так как WMSN dorgen... А в целом там 100-ни признаков да же те о которых Вы не задумываетесь. Тупо статистика. Пока доры не лезут в ТОП - их не трогуют, как только массово где-то забивают - банят.

fabmoretti, ну хуйни сайт знакомств, гугл 100% забанит на свежереге и хер разбанит. В Яндексе хоть есть живой саппорт, через месяц переписки может и разбанит временно.

Mik Foxi, У меня есть несколько сайтов на WP специально сделанных под адсенсе. Все статьи копипаст с разных источников и на каждом сайте примерно по 3-5к статей :) Домены свежереги.добавлены через панель вебмастерс гугла. На днях при один домен выпал с индекса и пришло письмо «счастья» от гугла - дескать на вашем сайте поисковый спам. Я поменял шаблон, убрал все лишние ссылки ( в том числе и внутреннюю перелинковку) и отправил на модерацию. Через 2 дня сайт опять был в индексе и давал траф! Так что и с гуглом можно договориться :)

Papaul, если он хуйнул 1 млн $, то скорее всего там будет и сео и реклама. Зачем гугл? А как же «бесплатный» траф?

Mik Foxi, может это реальный будущий начальник отдела «удушения» рус говорящих дорвейщиков? ;-) такие же будут организованы и для других стран / языков, ему все пишут признаки, будет составлена репрезентативная выборка со многих ресурсов и..