Search by WMSN

Гуглил про стемминг, нашел stemwords (libstemmer-tools), на первый взгляд это круче чем #phpMorphy.

Answers:

Наверное что-то хорошее...

Для меня это как матерное предложение. Мик не засоряй ленту )

стемминг надо юзать аккуратно, а то вместо поиска «кроссовок» выдаст «кроссовер» refwm.com

стемминг для «кроссовки» - «кроссов».
Неудивительно:)

Роман Питерский, там пока старый вариант, тупо отрубающий у всех слов 2 последних знака.

stemwords оказался гипертормознутым :(

Mik Foxi, А чем не нравится стеммер портера?

Mik Foxi, В итоге через неделю скитаний и поисков - всё будет работать через sphinx.
ps: проходили и знаем :)

webmaster, Да ладно. Сделает нормальній поиск и без костылей, на нативном sqlite.

уПопаБылаСобака, да вот его прикручиваю, стиммер Портера. Сейчас еще повторно FTS4 потестирую )

webmaster, ты не представляешь, какое наслаждение я испытываю от этих скитаний. За эти 2 суток я узнал много интересного, расширил свой кругозор ))) а тупо взять полностью готовый сфинкс я всегда успею.

Mik Foxi, чего FTS5 не тестируешь?

Роман Питерский, каждый час я узнаю что-то новое )))) я не знал о его существовании.

Роман Питерский, sqlite ой как давно я его не использовал...
перед mysql в full text search есть у sqlite какие-то преимущества? поиск с сортировкой по количеству найденных слов в названии хотя бы по миллиону строк с названиями товаров сколько занимает по времени?

webmaster, Блин вы меня заинтересовали с этим FTS5... Прочел только что документацию и пару статей.
Надо тестить на скорость запрос:
«sqlite SELECT * FROM quotes WHERE quotes MATCH 'believe' ORDER BY rank;»
charlesleifer.com

webmaster, Уже заложена некоторая релевантность скожая со сфинксом!

webmaster, а я так и не понял, где там про релеватность.

Mik Foxi, вот: sqlite.org
на русском о методе: ru.wikipedia.org
только надо тестить и пробывать со всеми европейскими языками хотя бы...

webmaster, А вообще Роман, спаисбо. Так-то об FTS5 что-то толком нигде и не написано... хотя со дня выхода уже прошло 3-4 месяца вроде )
вроде норм расширение для sqlite... там много фич добавили

webmaster, смотрю тесты FTS3: набор из 1 млн. документов 15Gb БД - поиск по одному слову занимает 2-3 мс, по нескольким словам - 20-30 мс, по нескольким словам с маской - 200-300 мс. С FTS4, а тем более FTS5 скорость явно выше будет.