Mik Foxi

Я уже говорил что Букварикс говно нечищенное с бредотекстами? Ну в общем говорю. Вордстат дает са...

Я уже говорил что Букварикс говно нечищенное с бредотекстами? Ну в общем говорю. Вордстат дает самые человеческие кеи.

Ответы:
zike zike #65245 2016-10-07 20:27
только хотел под вап клик доры запилить с кеями от букварикса... :(

Mik Foxi Mik Foxi #65248 2016-10-07 20:48
zike, ну там как и везде в основном - поисковые подсказки отовсюду.

watcher watcher #65249 2016-10-07 21:11
zike, жиза

Ilya Ilya #65250 2016-10-07 21:37
Мик, чем с вордстата собираешь?

Mik Foxi Mik Foxi #65254 2016-10-07 22:19
Ilya, хуманом. но надо переделывать, там хуйни понаписывал кривой.

bukvarix bukvarix #65255 2016-10-07 22:30
Mik Foxi, добрый вечер. Спасибо за критику нашей базы - она, конечно, не идеальна, человек всегда сделает лучше. Но во многих случаях проще доделать, чем делать с нуля. Основной источник нашей базы - это поисковые подсказки. Отсюда и плюсы и минусы (можно напарсить больше, но это все-таки подсказки, со всеми их минусами). Если есть время и желпние сделать базу лучше, и если получится сформулировать дополнительные правила по «плохим» ключевым словам - присылайте, мы улучшим наши алгоритмы чистки мусора. Дело в том, что когда иногда смотришь на выборку - понимаешь, что какие-то кеи лучше выкинуть, но не понимаешь, как это сформулировать (для чистки). Поэтому любая помощь будет кстати (если, конечно, есть время и желание).

bukvarix bukvarix #65256 2016-10-07 22:31
Есть также некоторые проблемы чистки, о которых мы знаем, но которые пока не придумали как «красиво» исправить (например, слова с точками, дефисами, подчеркиваниями, дубликаты с буквой ё...). В Буквариксе есть «!точная !частотность» - для быстрой чистки можно взять только слова с «!точной !частотностью» 0 (или больше, если нужно условие жестче). Если ещё нужно сильнее - то можно прогнать итоговую выборку через keycollector для получения « » - так будет ещё чище.

Mik Foxi Mik Foxi #65258 2016-10-07 22:37
bukvarix, я вообще сам всегда юзал кеи из подсказок, но решил от этого уйти (количество менять на качество). Самая большая неисправимая фигня в поисковых подсказках - в кеях с 4+ слов часто поисковики начинают подставлять вообще левые слова в конце, и пока качественнее для русских кеев чем вордстат не нашел.

bukvarix bukvarix #65259 2016-10-07 22:45
Mik Foxi, да, есть такая проблема. У нас к примеру база на самом деле значительно больше, но в итоговый Букварикс попадают только те слова, у которых широкая частотность от 1. Это немного уменьшает влияние проблемы, но не до конца. Кому то нужно количество (мусор сам отфильтрует), кому то - качество. То есть то что есть сейчас - некий компромисс.

zike zike #65260 2016-10-07 22:46
Mik Foxi, Магадан парсер, годится ?

bukvarix bukvarix #65261 2016-10-07 22:48
В подсказках хорошо то, что они в основном в правильной словоформе. В вордстате (правая колонка) - нужно дополнительно обработывать. Например, если поискать «деревянная мебель», то слева можно увидеть варианты неправильных словоформ «садовый мебель», «деревянный кровать».

Mik Foxi Mik Foxi #65264 2016-10-07 23:07
bukvarix, зато в вордстате редко встретишь «деревянная кровать скачать одежда» )))

bukvarix bukvarix #65265 2016-10-07 23:14
Mik Foxi, с таким примером Букварикс справится - у него частотность 0, в базу не попадет :) Но есть конечно и похуже - когда смотришь, видишь что генеренка, но частотность в вордстате есть, не иначе как накрутка.

Фарадей Фарадей #65271 2016-10-08 00:40
Mik Foxi, а программа словоеб или кейколлектор разве не могут дергать с вордстата? Что их не заюзал?

Брати Гадюкіни Брати Гадюкіни #65272 2016-10-08 01:14
bukvarix, А не пробовали юзать roostat.ru - сервис статистики запросов от rookee.ru? Так например делает keycollector. Там количество правильніх запросов раза в 2-3 больше.

jkeks jkeks #65276 2016-10-08 08:27
Букварикс через Алерты нашел трэд ?

Роман Питерский Роман Питерский #65280 2016-10-08 09:07
Mik Foxi, Penguin 6.0 с нужными фильтрами на 90% решает проблему чистки кейвордов буквариса и других баз, тем более что вордстат под бурж не катит.

bablo.black bablo.black #65281 2016-10-08 09:20
bukvarix, не обращайте внимания на Мика, он все базы хаит, но пока мы не видели его супер-пупер базы :)

bukvarix bukvarix #65282 2016-10-08 09:21
уПопаБылаСобака, нет, roostat.ru не парсим.

bukvarix bukvarix #65284 2016-10-08 09:23
jkeks, почти. В смысле алерты у нас есть, но в данном случае алерт почему-то не отработал (ничего не пришло). Нашли через поиск гугла «за последнюю неделю» - мы периодически мониторим так в конце недели. По алертам заметили что не всегда срабатывают (почему - неизвестно), поэтому в данном случае ручная перепроверка.

bukvarix bukvarix #65285 2016-10-08 09:26
bablo.black, спасибо за отзыв! :) Стараемся реагировать на критику и исправляться, если это в наших силах (просто не всегда все можно исправить).

Mik Foxi Mik Foxi #65286 2016-10-08 09:37
bablo.black, у меня нету супер баз, я тоже юзаю поисковые подсказки.

bukvarix bukvarix #65287 2016-10-08 10:24
jkeks, алерты зря обижали - только что и алерт пришел :)

one one #65293 2016-10-08 13:27
Что за алерты? Тоже хочу!

Archer Archer #65298 2016-10-08 15:13
Уходит очень много времени на чистку, согласен, но и плюсы есть - наличие кеев который нет в ВС. Я чищу Мега Леммой (не сочтите за рекламу)

bukvarix bukvarix #65299 2016-10-08 15:33
one, имеется в виде Google Alerts - можно настроить оповещения на e-mail по новым результатам Google по интересующим тебя словам: https://www.google.com/alerts?hl=ru

mng mng #65300 2016-10-08 16:05
микс помешался на яндексе

Mik Foxi Mik Foxi #65301 2016-10-08 17:00
mng, лучше синица в руках, чем журавль в небе, который срал на меня с высокой колокольни )))

jkeks jkeks #65302 2016-10-08 17:43
one, google алерты гугли

jkeks jkeks #65303 2016-10-08 17:46
Mik Foxi, нет, ну как-то же приходит трафик кому-то.. почему-то, я тоже в сознании получаю не тот объем Гугла, и от этого страдаэ..🚽🚽🚽