Search by WMSN

Mik, ты использовал при создании таблицы токенайзер Портера или заюзал дефолтный? Сегодня наконец то разобрался с FTS4 и допилил на нем поиск. Работает достаточно шустро: 100 товаров из базы на 3кк извлекает в среднем за 0.01 сек. Если в запросе использовать NEAR/5 +-пару цифр, релевантность очень хорошая. Для буржа походу Портер предпочтительный, для рунета х.з. Ты как думаешь?

Answers:

Сама база у меня просто виртуальная таблица с фтс4. Я нашел php либу для стемминга русских слов. При загрузке контента в базу - сохраняю оригинальное слово + нормализованное. И кстати учти что fts таблицы без типов данных (т.е. там пох text или integer) в итоге выборка с сортировкой по цене по умолчанию будет кривая, сравниваемая как строки.

Mik Foxi, понятно, спасибо. Я тоже только одну таблицу использую. Да, с сортировкой по цене не комильфо, но можно делать выборку, например 100-200 товаров, а потом уже их отдельно сортировать и выводить только нужные. Костыль, но заюзать можно)

Роман Питерский, костылей не надо. При запросе ORDER BY CAST(price AS INTEGER) ASC выравнивает сортировку чисел. price это имя столбца.

Mik Foxi, ок, спасибо