Текстовка под фарма доры?
На страницу Пред.  1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11  След.
Новая тема Написать ответ
# Вт Апр 14, 2015 11:09 amEgorka Зарег.: 29.11.2010 ; Сообщ.: 15Ответить с цитатой
демкой Хумана.
# Ср Апр 15, 2015 10:10 amMiss Content Зарег.: 05.03.2010 ; Сообщ.: 7628Ответить с цитатой
Цитата:
все это переваривает в полне съдобный текст


Это только тебе так кажется. Smile На самом деле глаз цепляет куча ошибок. Какой смысл в таких сайтах, если англоязычные пользователи все равно не будут там ничего заказывать.
# Ср Апр 15, 2015 10:14 amGostonP Зарег.: 19.07.2013 ; Сообщ.: 487Ответить с цитатой
Miss Content, думаю что тот кто работает с такими текстами и не собирается их показывать серчерам...
# Ср Апр 15, 2015 11:18 amTREVERS Зарег.: 20.06.2011 ; Сообщ.: 7034Ответить с цитатой
GostonP самое оно :thup:
# Вс Апр 19, 2015 2:45 pmyeretin Зарег.: 19.04.2015 ; Сообщ.: 183Ответить с цитатой
buy-propecia-5mg.com - чем генерят такое? это снипеты? что это вообще за дорген?
# Вс Апр 19, 2015 5:04 pmcyberianbrain Зарег.: 23.08.2009 ; Сообщ.: 179Ответить с цитатой
это копипаст
# Вс Апр 19, 2015 7:29 pmyeretin Зарег.: 19.04.2015 ; Сообщ.: 183Ответить с цитатой
cyberianbrain писал(а):
это копипаст



чем собирают такой чистый текст? и откуда? его ведь там не мало
# Вс Апр 19, 2015 7:45 pmGostonP Зарег.: 19.07.2013 ; Сообщ.: 487Ответить с цитатой
yeretin писал(а):
cyberianbrain писал(а):
это копипаст



чем собирают такой чистый текст? и откуда? его ведь там не мало



копипаст = Ctrl+C -------->Ctrl+V :oldher:

парсят статьи....
# Вс Апр 19, 2015 7:52 pmyeretin Зарег.: 19.04.2015 ; Сообщ.: 183Ответить с цитатой
GostonP писал(а):
yeretin писал(а):
cyberianbrain писал(а):
это копипаст



чем собирают такой чистый текст? и откуда? его ведь там не мало



копипаст = Ctrl+C -------->Ctrl+V :oldher:

парсят статьи....



Если бы текст был не такой чистый, то наверно ответ "парсят" меня бы вполне устроил, но... текст как по мне слишком чистый как для парсинга. может быть я просто не знаю волшебные статьи которые легко парсить без мусора или не знаю еще такого парсера.
# Вс Апр 19, 2015 7:55 pmGostonP Зарег.: 19.07.2013 ; Сообщ.: 487Ответить с цитатой
ContentDownloader
# Пн Апр 20, 2015 9:45 amTREVERS Зарег.: 20.06.2011 ; Сообщ.: 7034Ответить с цитатой
Не только - Зенка умеет собирать статьи и стыковать их по заданному алгоритму, вот к примеру как вариант => zennolab .com/discussion/threads/besplatnyj-unikalnyj-kontent-dlja-belyx-sajtov.16769/
А так ещё можно расмотреть такой вариант - lime.black/120
# Пн Апр 20, 2015 3:34 pmyeretin Зарег.: 19.04.2015 ; Сообщ.: 183Ответить с цитатой
Что-то я сам протупил и никто не заметил.
А ничего что в примере выше текст с уникальностью 99%?
Копипаст такого не даст, как и парсеры.
Это явно чем-то генерится.
# Пн Апр 20, 2015 4:16 pmTREVERS Зарег.: 20.06.2011 ; Сообщ.: 7034Ответить с цитатой
а могёт это уже доры на пандоре запилены по новому алгогенератексту - pandoraboxx.ru/syntaxtextgen.php
# Чт Апр 23, 2015 10:59 amYabuti Зарег.: 28.11.2008 ; Сообщ.: 12630Ответить с цитатой
Не, синонимайзинг все равно не даст 100% уникальности при высоком качестве и распознаванием нормальным алгоритмом.
Для примера - проверка уникальности через content-watch.ru какого-нибудь текста из ВебАрхива показывает 100% уникальность. Тот же текст, проверяемый на уникальность через text.ru дает уникальность 10-15%. Для англоязычных текстов свои аналоги.

По сабжу - глянь в сторону приватных хранилищ данных, вроде библиотек, отчетов исследований и т.д. Кто в меде учится, знает, что есть такие места, где платный доступ, только для врачей, провизоров-фармацевтов или студентов медицинских вузов.
# Чт Апр 23, 2015 3:12 pmyeretin Зарег.: 19.04.2015 ; Сообщ.: 183Ответить с цитатой
Yabuti писал(а):


По сабжу - глянь в сторону приватных хранилищ данных, вроде библиотек, отчетов исследований и т.д. Кто в меде учится, знает, что есть такие места, где платный доступ, только для врачей, провизоров-фармацевтов или студентов медицинских вузов.



Ты когда такое предлагаешь хотябы видел эти тексты? Какие они?
Их структуру? В них много формул, спецзнаков и тп. Так можно насобирать пару десятков страниц, это да, но больше задолбешься.
Обычно это pdf который надо еще конвертировать в текст. Это все эпический геморой, я таким занимался, но меня быстро попустило.
Новая тема Написать ответ    ГЛАВНАЯ ~ ФАРМА
 На страницу Пред.  1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11  След.
Любое использование материалов, размещенных на ArmadaBoard.com, без разрешения владельцев ArmadaBoard.com запрещено.