Search by WMSN

Я уже говорил что Букварикс говно нечищенное с бредотекстами? Ну в общем говорю. Вордстат дает самые человеческие кеи.

Answers:

только хотел под вап клик доры запилить с кеями от букварикса... :(

zike, ну там как и везде в основном - поисковые подсказки отовсюду.

zike, жиза

Мик, чем с вордстата собираешь?

Ilya, хуманом. но надо переделывать, там хуйни понаписывал кривой.

Mik Foxi, добрый вечер. Спасибо за критику нашей базы - она, конечно, не идеальна, человек всегда сделает лучше. Но во многих случаях проще доделать, чем делать с нуля. Основной источник нашей базы - это поисковые подсказки. Отсюда и плюсы и минусы (можно напарсить больше, но это все-таки подсказки, со всеми их минусами). Если есть время и желпние сделать базу лучше, и если получится сформулировать дополнительные правила по «плохим» ключевым словам - присылайте, мы улучшим наши алгоритмы чистки мусора. Дело в том, что когда иногда смотришь на выборку - понимаешь, что какие-то кеи лучше выкинуть, но не понимаешь, как это сформулировать (для чистки). Поэтому любая помощь будет кстати (если, конечно, есть время и желание).

Есть также некоторые проблемы чистки, о которых мы знаем, но которые пока не придумали как «красиво» исправить (например, слова с точками, дефисами, подчеркиваниями, дубликаты с буквой ё...). В Буквариксе есть «!точная !частотность» - для быстрой чистки можно взять только слова с «!точной !частотностью» 0 (или больше, если нужно условие жестче). Если ещё нужно сильнее - то можно прогнать итоговую выборку через keycollector для получения «[!точной !частотности !с !фиксированным !порядком !слов]» - так будет ещё чище.

bukvarix, я вообще сам всегда юзал кеи из подсказок, но решил от этого уйти (количество менять на качество). Самая большая неисправимая фигня в поисковых подсказках - в кеях с 4+ слов часто поисковики начинают подставлять вообще левые слова в конце, и пока качественнее для русских кеев чем вордстат не нашел.

Mik Foxi, да, есть такая проблема. У нас к примеру база на самом деле значительно больше, но в итоговый Букварикс попадают только те слова, у которых широкая частотность от 1. Это немного уменьшает влияние проблемы, но не до конца. Кому то нужно количество (мусор сам отфильтрует), кому то - качество. То есть то что есть сейчас - некий компромисс.

Mik Foxi, Магадан парсер, годится ?

В подсказках хорошо то, что они в основном в правильной словоформе. В вордстате (правая колонка) - нужно дополнительно обработывать. Например, если поискать «деревянная мебель», то слева можно увидеть варианты неправильных словоформ «садовый мебель», «деревянный кровать».

bukvarix, зато в вордстате редко встретишь «деревянная кровать скачать одежда» )))

Mik Foxi, с таким примером Букварикс справится - у него частотность 0, в базу не попадет :) Но есть конечно и похуже - когда смотришь, видишь что генеренка, но частотность в вордстате есть, не иначе как накрутка.

Mik Foxi, а программа словоеб или кейколлектор разве не могут дергать с вордстата? Что их не заюзал?

bukvarix, А не пробовали юзать roostat.ru - сервис статистики запросов от rookee.ru? Так например делает keycollector. Там количество правильніх запросов раза в 2-3 больше.

Букварикс через Алерты нашел трэд ?

Mik Foxi, Penguin 6.0 с нужными фильтрами на 90% решает проблему чистки кейвордов буквариса и других баз, тем более что вордстат под бурж не катит.

bukvarix, не обращайте внимания на Мика, он все базы хаит, но пока мы не видели его супер-пупер базы :)

уПопаБылаСобака, нет, roostat.ru не парсим.

jkeks, почти. В смысле алерты у нас есть, но в данном случае алерт почему-то не отработал (ничего не пришло). Нашли через поиск гугла «за последнюю неделю» - мы периодически мониторим так в конце недели. По алертам заметили что не всегда срабатывают (почему - неизвестно), поэтому в данном случае ручная перепроверка.

bablo.black, спасибо за отзыв! :) Стараемся реагировать на критику и исправляться, если это в наших силах (просто не всегда все можно исправить).

bablo.black, у меня нету супер баз, я тоже юзаю поисковые подсказки.

jkeks, алерты зря обижали - только что и алерт пришел :)

Что за алерты? Тоже хочу!

Уходит очень много времени на чистку, согласен, но и плюсы есть - наличие кеев который нет в ВС. Я чищу Мега Леммой (не сочтите за рекламу)

one, имеется в виде Google Alerts - можно настроить оповещения на e-mail по новым результатам Google по интересующим тебя словам: google.com

микс помешался на яндексе

mng, лучше синица в руках, чем журавль в небе, который срал на меня с высокой колокольни )))

one, google алерты гугли

Mik Foxi, нет, ну как-то же приходит трафик кому-то.. почему-то, я тоже в сознании получаю не тот объем Гугла, и от этого страдаэ..🚽🚽🚽