Напиши свой генератор текстов!
На страницу Пред.  1, 2, 3, 4  След.
Новая тема Написать ответ
# Пт Ноя 09, 2007 9:41 pminferno[DGT] Зарег.: 22.07.2007 ; Сообщ.: 350Ответить с цитатой
Пост, конечно, хорош. Но не нужно принимать его за ТЗ. ОГРОМНОЕ кол-во нюансов опущено. С партнером примерно месяцев 6-7 назад решили создать подобную систему генерации. Было перерыто огромное кол-во материала, пробовали, делали. Добились неплохих результатов(еще ни один дор не забанен). Но все равно в системе постоянно что-то меняется, улучшается и оптимизируется. По прочтению сего поста появилось как минимум 2 новые идеи по улучшению генератора.
Content is King. Вацлав, принимай респекты Smile
# Сб Ноя 10, 2007 12:24 amABC Зарег.: 17.10.2007 ; Сообщ.: 3Ответить с цитатой
Сколько будет стоить денег заказать такой генератор текстов у программиста?
# Сб Ноя 10, 2007 3:07 aminferno[DGT] Зарег.: 22.07.2007 ; Сообщ.: 350Ответить с цитатой
Тут не в деньгах дело Smile
Программисту нужно знать, что писать. Нужны четкие алгоритмы генерации.
# Чт Ноя 15, 2007 2:03 amSirgey Зарег.: 06.05.2007 ; Сообщ.: 116Ответить с цитатой
По моему нормальный алгоритм, а вы все ругаете потому - что не хотите подать виду.
Вацлав - респект!

Главный вопрос тут - набивка баз и конструкций. Автоматом это сделать нельзя, так как в инглише, как и в русском есть слова которые меняют смысл и часть речи. В результате если автоматом забивать - будут ошибки, если вручную - то долго и будет палиться по общему шаблону предложения.

Имхо, ссылки рулят, а для генерации доров и марков подойдёт.

To inferno[DGT]: хочешь скажу почему не забанено? потому - что по гестам не срали, в топ не вылазили и траф не шёл. Проспамь по гестам/форумам, выйди в топ и получи траф. Забанят.
# Вс Dec 30, 2007 10:43 pmFOX Зарег.: 11.03.2007 ; Сообщ.: 53Ответить с цитатой
На серджинсе уже двое предоставляют сервис по размножению русскоязычных статей... там из 1 статьи при самом минимальном участии человека делается 1К статей сохраняющих смысл и логичискцую структуру оригинальной, тоесть получаются тексты для людей и поисковики их видят как разные и не клеют. Генерит довольно прилично судя по демкам и отзывам тех кто пользовался. Для английских текстов таких сервисов пока нет к сожалению, я вот лично лучше платил бы за такое размножение стаей чем за пиаристые ссылки.
# Пн Dec 31, 2007 12:41 amHello_Kitty Зарег.: 30.04.2007 ; Сообщ.: 10763Ответить с цитатой
FOX, дай в личку контакты этих субъектов с серчэнджинса. или топик тот в личку напиши.
# Пн Dec 31, 2007 1:17 amBrokenBrake Зарег.: 16.02.2007 ; Сообщ.: 3432Ответить с цитатой
Насколько я знаю, эти люди размножают статьи полуручным методом. Там не генератор текстов, просто автоматизация некоторых рутинных задач по синонимизации.
# Пт Янв 04, 2008 5:14 pmFOX Зарег.: 11.03.2007 ; Сообщ.: 53Ответить с цитатой
Да там насколько я понял с описания на сайте есть часть ручной работы, но учитывая какими масштабами можно ворочать то это просто пыль на сапогах... замутить такое бы под инглыш.. ух
# Сб Янв 05, 2008 2:54 amDark Elf Зарег.: 23.12.2007 ; Сообщ.: 1545Ответить с цитатой
Можно прочитать на aot.ru как это на самом деле выглядит с научной точки зрения и даже скачать софт для экспериментов. Это что касается семантики.
Мы делали немножко другой генератор, именно ГЕНЕРАТОР текстов, основанный на алгоритме "Элиза" почти 50-летней давности. А именно на фокусе внимания. Смысл в том, что читая фразу в тексте человек в качестве локального контекста воспринимает только несколько предыдущих фраз и общий контекст. То есть по мере его продвижения по тексту, его фокус внимания скользит вперед. Соответственно, программа, генерирующая текст, должна использовать тот же принцип. Используя систему джокеров, можно генерировать текст вполне релевантный глобальному контексту, хотя и не несущий никакой практической ценности, но вполне связный и читаемый. Более того, использовав модель цифровой ДНК, можно создать популяцию полиморфных зверушек, совершенствующих алгоритм (вернее около 100 его параметров, выступающих в роли генов) для генерации текстов, наиболее удовлетворяющих пожеланиям СЕ. Ограниченно-публичное тестирование алгоритма БОБОТ-666 должно было начаться в середине декабря, даже на паре форумов были набраны тестеры, был сделан официальный сайт (bobot.net.ru), но по некоторым причинам отложено. Результаты жизнедеятельности самой ранней версии лежат здесь dolphin-cafe.narod.ru Это мысли о заработке в Инете Smile
# Сб Янв 05, 2008 8:59 pmCabal Зарег.: 20.10.2007 ; Сообщ.: 1360Ответить с цитатой
Dark Elf, весьма кошерно. На человека правда непохоже но это вроде бы даже можно читать.
# Вс Янв 06, 2008 3:01 amdb Зарег.: 04.12.2006 ; Сообщ.: 210Ответить с цитатой
Вацлав
Порадовал однако, только слегка поздновато.... я месяц голову ломал как ТЗ програмеру поставить, в итоге поулчился более разширенный вариант... Прогер идею подхватил, в тему въехал, обещал еще нейронку под это дело обучить... бум надеятся получится толковое... Drinks or Beer
# Вт Янв 08, 2008 6:07 pmKerk Зарег.: 30.09.2007 ; Сообщ.: 550Ответить с цитатой
Я распарсил словарь английской морфологии с aot.ru в базу FireBird (вся информация о слове вытаскивается одним SQL-запросом). Подумываю выложить для скачивания, но сомневаюсь, ибо FireBird не особо популярен у веб-мастеров, а в MySQL я не буду переводить из принципа.
# Вт Янв 08, 2008 6:38 pmdb Зарег.: 04.12.2006 ; Сообщ.: 210Ответить с цитатой
выкладывай в FB, приймем как родненькую )
# Ср Янв 09, 2008 10:00 amRabbit Зарег.: 01.08.2005 ; Сообщ.: 19787Ответить с цитатой
db писал(а):
выкладывай в FB, приймем как родненькую )

воть Smile

Словарь английской морфологии
# Пт Апр 25, 2008 5:05 pmalexf2000 Зарег.: 28.10.2005 ; Сообщ.: 62Ответить с цитатой
Описанный алгоритм будет делать текст, который ничем не отличается от простейшего синонимайзера (http://awt.win32utils.com/synonyms/), текст из него будет вылезать абсолютно нечитаемый. А чтобы он был действительно грамматически верным, надо решить одну небольшую задачку о которой скромно умолчали - определять к какой части речи относится слово в контексте предложения. Один небезизвестный производитель п/о для машинного перевода эту задачку решает уже лет 15, но особых прорывов в качестве машинногоперевода что-то пока не заметно.
Разница с синонимайзером у этого алгоритма только в том, как распределяется работа - для этой реализации нужно сначала набрать базы шаблонов фраз, сами базы слов и потом можно быстро генерить много бреда. А для синонимайзера нужен просто любой текст который потом перекраивается синонимами, базы которых есть в готовом виде. То есть чтобы получить средненький результат, нужно затратить усилия которые лучше пустить в мирных целях - на расстановку ссылок на текст полученный из цепей Маркова. Smile
Новая тема Написать ответ    ГЛАВНАЯ ~ ПОЛЕЗНЫЕ СТАТЬИ
 На страницу Пред.  1, 2, 3, 4  След.
Любое использование материалов, размещенных на ArmadaBoard.com, без разрешения владельцев ArmadaBoard.com запрещено.