Search by WMSN

Палю тему. идея генератора контента. #палю тему

Answers:

интересно )

Я вообще начинал делать такой генератор. Идея офигенна и получается вполне. Но потом хотения не хватило и я забил.

Вся сложность - создать мегабазу на подобии базы синонимов. Только туда впихнуть не синонимы, а просто слова с одинаковым падежом, склонением, родом и т.п. че там есть в русском языке по правилам. ну и дальше замена на синтаксически похожие слова, с соблюдением исходной (правильной) структуры предложения, но с полностью другим содержанием.

Ребята, это называется спин. Он работает и не плохо. В Nazapad про него рассказывали, что тема годная и можно из одной статьи нахерачить кучу и все они пойдут в индекс норм и будет годн

Mik Foxi, я тоже делал. я зашел так: нашел 5000 самых употребляемых слов в русском языке и начал для каждого придумывать слово-замену, типа схожее, но не синоним или недосиноним. но 5000 в одиночку заменять оказалось сложновато, это дисциплина нужна

Парсим тематические тексты. Прходимся по словам морфером. Заносим в БД полное значения каждого слова (падеж, склонение и т.д.). Разбиваем на предложения. Составляем схему каждого предложения по словам в виде хешей значений слова. Далее рандомно дергаем из БД слова по их хешу. Профит. Я так делал но выходит отличнейший бредогенератор. Можно конечно усложнить и сделать хеши по словосочетаниям. Качество при этом вырастет, но упадет уникальность. К тому же нужна довольно большая база тематических текстов, а это накладно.

уПопаБылаСобака, да примерно такая и у меня идея была.

Mik Foxi, Можно конечно сделать централизованный сервер, куда будут отправляться все тексты со своих доров для анализа и модификации. Таким образом сама по себе будет расти база и актуализироваться. Единственное нужно предусмотреть фактор тематичности.

уПопаБылаСобака, пока у меня нету желания и вдохновения делать все это. Но вдруг кому эта идея понравится и сделает.

sandbox.onlinephpfunctions.com не благодарите