Search by WMSN

В продолжение моих мыслей про #json, вопрос к программистам, как бы вы реализовали поиск по такой «базе» (отдельным файлам)? У меня пока только одна мысль, unix комманда find, выполненная из php через exec. Вроде быстро получается, дальше результат (список файлов) кешировать в json файл, для дальнейшей постраничной разбивки поиска и т.п.

Answers:

Программист отвечает: хуйней маешься

Dench, нету такого ответа )))

тут программистов 0,2% )

jonamid, их тут больше, но они ленивы, чтоб отвечать )))

Диски замучаешь.
ЗЫ: Чего только не придумают, чтобы СУБД не использовать :)

Dench, ну тут еще не факт, что поиск по mysql, sqlite и т.п. «как у всех» будет меньше грузить диск. По моим теоретическим подсчетам и замерам - такой тупо поиск по файловой системе наоборот может снизить нагрузку на диск. Если бы не желание экспериментировать - может быть и сидели бы мы на статичном html или mysql без появления новых типов баз данных, фреймворков и прочего...

Dench, пока я это просто из научно познавательных целей изучаю. Но вдруг в этом кроется какая-нибудь гениальность )))

Mik Foxi, Фигней занимаешься - честно. Нужен поиск - делай там mysql + индексы и ищи. Короче результат от решения этой задачи таким способом не стоит того плюса который ты возможно получишь. Возьми тогда уже сфинкс разверни на отдельном сервере, загони туда все свои доры и используй его для поиска... )))

Мик, БД в файлой системе - это уже давным-давно пройденный этап в развитии систем хранения.
Из всего этого и выросли различные СУБД.
А то, что ты сейчас делаешь - это шаг (и не один) назад.
Для твоего доргена лучший вариант - sqlite. Лучшего ты уже не придумаешь

А вот для моего доргена лучший вариант - MariaDB (mysql по простому говоря)

Лучше сосредоточься на развитии собственно доргена, реализуй гениальности в деле:)

doorwaymoney, у меня сейчас нету какой-то практической задачи и надобности ни в json ни тем более в поиске по нему ))) мне просто интересно изучить данный вопрос, в формате «а вдруг получится круче».

Вообще вспомнилось, как в гипердревние времена, году так в 2007-2008 помню был у меня блог с дохренастраниц (тыщ около 10) на ластоблоге, там вроде данные хранились в виде сериализованых массивов. Так вот тогда у меня вдс с 256 мб оперативки, почти дефолтным апачем (я тогда в сисадминстве ничего не понимал), выдерживал по 100-150к уников трафа без проблем, хотя вордпрессы с mysql в аналогичных условиях умирали уже при 1000 униках. И поиск по файлам работал достаточно быстро.

Dench, так сейчас NoSQL в тренде, что тоже часто «на файлах». И давайте от доров отстранимся, не дорами едиными жив интернет. Дорген я не планирую переделывать с sqlite на что-то другое.

Mik Foxi, NoSQL - это не только sql :))
«no only sql»
Вордпрес - это клинический случай. работал админом на хостинге - 80 процентов нагрузки на сервер БД приносили пользователи вордпресса.

Откуда у тебя в 2008 году было столько трафика? Тогда людей то столько в интернете небыло.

Atom, тогда трафик был в блогопоиске яндекса, я делал дорвеи на ЖЖ по трендам (хотя такого понятия как тренды тогда вроде еще небыло, было типа «обсуждаемое в блогах») и сливал на свой блог, на котором эти 100-150к уников конвертились в 500$ дейли )))

Atom, Я вот щас вспомнил - не тем я занимался 10-15 лет назад:)

Atom, конвертил тогда на адсенсе.

Mik Foxi, Ну так голый html рулит. Но речь о том что в данный момент нет 100-150К уников... Ну с той же вероятностью самопис на мускл, держал бы те же 100-150К. Я вот смотрю на свои ГС... С учетом поисковиков и т.д. спокойно держат около 7-10 обращений к сайту в сек на виртуалке. А там и поиск тупо LIKE без оптимизации и прочая ересь...

Файловая бд- на самом деле имеет право на жизнь, если планируется делать чтото вроде html сайта. То есть Запрос- Чтение из одного файла. БД же нам предлагает кучу функций с поискомобъединениям. Делал первые доры на такои кэше. Всё круто. БД значительно проигрывает по простому чтению. Но если нужно выполнять поиск, даже по простому LIKE - думаю нагрузка на диск тут будет значительно больше чем в БД.

Ded, а это называется проектирование структуры БД, накосячить со структурой можно с любым ПО.

Mik Foxi, вот правильно! Просто надо уметь готовить индексы :)