Search by WMSN

Я все таки допилил #уникализатор для #дорвеев. Вышло хорошо. Словарь на 92к строк в комплекте. Приобрести можно тут russianwmshop.ru

Answers:

Скидки будут?

На plati.ru как-то солидней было бы, первый раз вижу этот магаз

сколько по времени выполняется обработка?

как с баном после этого мода ?

Тоже интересует вопрос скорости обработки строкового массива

На 1x3000 /1024Mb/ SSD Время генерации: ~4.0 Sec. Памяти кушает: ~20044 Kb.

Подожду когда Mik Foxi в обнове выкинет :)

имхо, от бана это не спасет и в топ не выведет.

Словарь под en есть?

А что за конент у тебя в доре, откуда? Это же не с серпа.

one, что дорген спарсил то и уникализирует. Все те же снипеты.

ctac911, Пока нету, если очень нужно могу поискать ))

А локальная уникальность какая ? Порылся в интернете тоже заморочился, судя по всему нихуя не будет работать скрипт. Вот доказательства: habrahabr.ru habrahabr.ru

cloud7, как такая локальная ? )) Если шлакоблочный контент из снипетов яндекс ест, значит улучшенную версию точно сьет.

Vladimir, да мне кажется сути не меняет. Если взять статистический проанализировать тексты с используемым вами словарем, чем занимается ПС в процессах обработки данных до ранжирования, то в любом случае чем больше объем данных будет уникализирован этим синонимайзером тем больше шансов разоблачения генерации(синонимизации). Можно сказать что даже синонимайзер делает хуже для уникализации сниппетов. Решая проблему увеличением кол-ва слов - увеличивается время обработки ну следолвательно, для массовой генерации синонимайзер не выгоден. Проще перемешать текстовку по Маркову или другим алгоритмом.