На страницу Пред. 1, 2, 3, 4 След. |
|
|
Пост, конечно, хорош. Но не нужно принимать его за ТЗ. ОГРОМНОЕ кол-во нюансов опущено. С партнером примерно месяцев 6-7 назад решили создать подобную систему генерации. Было перерыто огромное кол-во материала, пробовали, делали. Добились неплохих результатов(еще ни один дор не забанен). Но все равно в системе постоянно что-то меняется, улучшается и оптимизируется. По прочтению сего поста появилось как минимум 2 новые идеи по улучшению генератора.
Content is King. Вацлав, принимай респекты |
|
|
|
|
|
Сколько будет стоить денег заказать такой генератор текстов у программиста? |
|
|
|
|
|
Тут не в деньгах дело
Программисту нужно знать, что писать. Нужны четкие алгоритмы генерации. |
|
|
|
|
|
По моему нормальный алгоритм, а вы все ругаете потому - что не хотите подать виду.
Вацлав - респект!
Главный вопрос тут - набивка баз и конструкций. Автоматом это сделать нельзя, так как в инглише, как и в русском есть слова которые меняют смысл и часть речи. В результате если автоматом забивать - будут ошибки, если вручную - то долго и будет палиться по общему шаблону предложения.
Имхо, ссылки рулят, а для генерации доров и марков подойдёт.
To inferno[DGT]: хочешь скажу почему не забанено? потому - что по гестам не срали, в топ не вылазили и траф не шёл. Проспамь по гестам/форумам, выйди в топ и получи траф. Забанят. |
|
|
|
|
|
На серджинсе уже двое предоставляют сервис по размножению русскоязычных статей... там из 1 статьи при самом минимальном участии человека делается 1К статей сохраняющих смысл и логичискцую структуру оригинальной, тоесть получаются тексты для людей и поисковики их видят как разные и не клеют. Генерит довольно прилично судя по демкам и отзывам тех кто пользовался. Для английских текстов таких сервисов пока нет к сожалению, я вот лично лучше платил бы за такое размножение стаей чем за пиаристые ссылки. |
|
|
|
|
|
FOX, дай в личку контакты этих субъектов с серчэнджинса. или топик тот в личку напиши. |
|
|
|
|
|
Насколько я знаю, эти люди размножают статьи полуручным методом. Там не генератор текстов, просто автоматизация некоторых рутинных задач по синонимизации. |
|
|
|
|
|
Да там насколько я понял с описания на сайте есть часть ручной работы, но учитывая какими масштабами можно ворочать то это просто пыль на сапогах... замутить такое бы под инглыш.. ух |
|
|
|
|
|
Можно прочитать на aot.ru как это на самом деле выглядит с научной точки зрения и даже скачать софт для экспериментов. Это что касается семантики.
Мы делали немножко другой генератор, именно ГЕНЕРАТОР текстов, основанный на алгоритме "Элиза" почти 50-летней давности. А именно на фокусе внимания. Смысл в том, что читая фразу в тексте человек в качестве локального контекста воспринимает только несколько предыдущих фраз и общий контекст. То есть по мере его продвижения по тексту, его фокус внимания скользит вперед. Соответственно, программа, генерирующая текст, должна использовать тот же принцип. Используя систему джокеров, можно генерировать текст вполне релевантный глобальному контексту, хотя и не несущий никакой практической ценности, но вполне связный и читаемый. Более того, использовав модель цифровой ДНК, можно создать популяцию полиморфных зверушек, совершенствующих алгоритм (вернее около 100 его параметров, выступающих в роли генов) для генерации текстов, наиболее удовлетворяющих пожеланиям СЕ. Ограниченно-публичное тестирование алгоритма БОБОТ-666 должно было начаться в середине декабря, даже на паре форумов были набраны тестеры, был сделан официальный сайт (bobot.net.ru), но по некоторым причинам отложено. Результаты жизнедеятельности самой ранней версии лежат здесь dolphin-cafe.narod.ru Это мысли о заработке в Инете |
|
|
|
|
|
Dark Elf, весьма кошерно. На человека правда непохоже но это вроде бы даже можно читать. |
|
|
|
|
|
Вацлав
Порадовал однако, только слегка поздновато.... я месяц голову ломал как ТЗ програмеру поставить, в итоге поулчился более разширенный вариант... Прогер идею подхватил, в тему въехал, обещал еще нейронку под это дело обучить... бум надеятся получится толковое... |
|
|
|
|
|
Я распарсил словарь английской морфологии с aot.ru в базу FireBird (вся информация о слове вытаскивается одним SQL-запросом). Подумываю выложить для скачивания, но сомневаюсь, ибо FireBird не особо популярен у веб-мастеров, а в MySQL я не буду переводить из принципа. |
|
|
|
|
|
выкладывай в FB, приймем как родненькую ) |
|
|
|
|
|
|
Описанный алгоритм будет делать текст, который ничем не отличается от простейшего синонимайзера (http://awt.win32utils.com/synonyms/), текст из него будет вылезать абсолютно нечитаемый. А чтобы он был действительно грамматически верным, надо решить одну небольшую задачку о которой скромно умолчали - определять к какой части речи относится слово в контексте предложения. Один небезизвестный производитель п/о для машинного перевода эту задачку решает уже лет 15, но особых прорывов в качестве машинногоперевода что-то пока не заметно.
Разница с синонимайзером у этого алгоритма только в том, как распределяется работа - для этой реализации нужно сначала набрать базы шаблонов фраз, сами базы слов и потом можно быстро генерить много бреда. А для синонимайзера нужен просто любой текст который потом перекраивается синонимами, базы которых есть в готовом виде. То есть чтобы получить средненький результат, нужно затратить усилия которые лучше пустить в мирных целях - на расстановку ссылок на текст полученный из цепей Маркова. |
|
|
|
|
|
|
|