Индексация и ранжирование автопереводного контента
На страницу Пред.  1, 2
Новая тема Написать ответ
# Чт Июл 21, 2016 2:44 pmashiko Зарег.: 02.08.2010 ; Сообщ.: 4127Ответить с цитатой
Цитата:
автоматический транслейт иногда такие перлы выдает :mrrgreen:


Неудивительно, особенно если учесть, что много языковых пар переводятся машиной (в частности, Гуглом) не напрямую, а через язык-посредник. Подобие "глухого телефона" получается Smile
# Пт Июл 22, 2016 1:03 pmАлизандр Зарег.: 06.04.2010 ; Сообщ.: 4647Ответить с цитатой
Цитата:
А молдавский до 1989 года вообще кириллицей писался, единственный из романских языков.


А вон, кстати, выше Nea Cool'a и Deragru ярко отожгли - и тебе по-румынски, и по-молдавски, и на латинице, и на кириллице сбацали Smile :thup: . Приходилось бывать в Молдавии, знакомо Smile .

Кстати, Nea, я смотрю, ты у нас на форуме на многих языках шарашишь Smile . Переводчица или полиглотка? Wink
# Вс Июл 24, 2016 3:09 pmazsx Зарег.: 06.06.2009 ; Сообщ.: 65Ответить с цитатой
есть запрос, например moscow. Есть 1 миллион страниц, которые имеют хороший показатель по ПФ по просмотрам. Например, собрали кеи, спарсили хрефером. Выделяем на страницах текстовую часть, сокращаем теги, разбиваем текст по пассажам. Чем больше в вашем переводе будет совпадений на пассажах, тем меньше вам надо редактировать переведенный текст. Логично, что лучше заранее переводить абзацами на несколько переводчиков и сверять каждый вариант на лучшие совпадения с идеалом. Наверное, для борьбы с фильтрами лучше проблемный текст ваще не размещать. Всё можно автоматизировать, профит.
# Пн Июл 25, 2016 9:29 amGraf Зарег.: 14.07.2014 ; Сообщ.: 2004Ответить с цитатой
azsx, интересный способ. :thup: Никогда про такой не слышал.
# Ср Июл 27, 2016 7:58 pmNea Cool'a Зарег.: 14.09.2015 ; Сообщ.: 134Ответить с цитатой
Цитата:
Переводчица или полиглотка? Wink


La historia calla... История умалчивает, в смысле Smile .

Цитата:
разбиваем текст по пассажам


+1, классный способ! :thup: И да, при работе с пассажами надо учитывать вот такую штуку, к примеру:

Сегодня с утра шёл дождь. Солнце не светило - тут два пассажа.

Сегодня с утра шёл дождь.Солнце не светило - а вот тут пассаж всего один.
# Чт Июл 28, 2016 2:57 amazsx Зарег.: 06.06.2009 ; Сообщ.: 65Ответить с цитатой
Nea Cool'a никогда о таком не слышал, нельзя ли источник - определение пассаж?
В моем понимании пассаж - это неделимая часть предложения. Типа
Сегодня с утра
шёл дождь
Солнце не светило
зы
а ваш вариант - это перевод текста предложениями, логично что тексты будут синематически правильными на входе, не?
# Чт Июл 28, 2016 9:21 amCoooler Зарег.: 21.06.2010 ; Сообщ.: 4368Ответить с цитатой
Цитата:
И да, при работе с пассажами надо учитывать вот такую штуку, к примеру


И в чём же эта самая штука? Одинаковые же твои примеры.
# Чт Июл 28, 2016 11:08 amazsx Зарег.: 06.06.2009 ; Сообщ.: 65Ответить с цитатой
Coooler обратите, пожалуйста, внимание. Точка не обязательно рвет пассаж, например "и т.д", а также другие сокращения. Ну это как я понимаю.
# Чт Июл 28, 2016 7:12 pmniramus Зарег.: 05.12.2009 ; Сообщ.: 477Ответить с цитатой
Nea Cool'a писал(а):
Цитата:
Переводчица или полиглотка? Wink


La historia calla... История умалчивает, в смысле Smile .

Цитата:
разбиваем текст по пассажам


+1, классный способ! :thup: И да, при работе с пассажами надо учитывать вот такую штуку, к примеру:

Сегодня с утра шёл дождь. Солнце не светило - тут два пассажа.

Сегодня с утра шёл дождь.Солнце не светило - а вот тут пассаж всего один.



Означает ли это что ИИПС никогда не будет умнее человека, если ИИПС не отличает существительное от глагола прошедшего рода - ?

И разве ИИПС может быть настолько неумной, чтобы проглатывать точки?

Тогда будущие дорвеи будут строиться по принципу изобретения новых слов, которые постепенно будут вживляться в "живой" форум. А за тем уже ИИПС будет подстраиваться под них.
# Пт Июл 29, 2016 3:22 pmDoc Зарег.: 31.03.2010 ; Сообщ.: 4909Ответить с цитатой
Цитата:
не отличает существительное от глагола прошедшего рода


Не знаю насчет частей речи, но сейчас для Гугла слово в единственном и множественном числе может расцениваться как 2 разных ключевика
# Пт Авг 19, 2016 1:50 pmIrbis Зарег.: 11.03.2010 ; Сообщ.: 3641Ответить с цитатой
Понимающие язык машины были бы очень полезны. Но на данном этапе мы не знаем, как их построить.
# Сб Авг 20, 2016 3:08 amSkyworker Зарег.: 25.12.2013 ; Сообщ.: 11416Ответить с цитатой
Coooler писал(а):
Цитата:
И да, при работе с пассажами надо учитывать вот такую штуку, к примеру


И в чём же эта самая штука? Одинаковые же твои примеры.

Разница все-таки есть. В одном тексте пробел между предложениями есть, а в другом нет. Вопрос знатокам: синонимизация текстов даёт какой-то эффект, если она производится без потери смысла?
# Пн Авг 22, 2016 9:35 amceber Зарег.: 13.05.2010 ; Сообщ.: 4290Ответить с цитатой
Цитата:
Вопрос знатокам: синонимизация текстов даёт какой-то эффект, если она производится без потери смысла?


Думаю, да. Сравните:

Шла Саша по шоссе и сосала сушку.
Прогуливалась Саша по дороге и облизывала рогалик.
# Пт Мар 17, 2017 1:30 pmGraf Зарег.: 14.07.2014 ; Сообщ.: 2004Ответить с цитатой
Google Translate недавно подключил русский язык к переводу с глубинным обучением (нейронные сети). Так что, качество переводов должно еще больше возрасти.
Новая тема Написать ответ    ГЛАВНАЯ ~ ПОИСКОВЫЕ СИСТЕМЫ
 На страницу Пред.  1, 2
Любое использование материалов, размещенных на ArmadaBoard.com, без разрешения владельцев ArmadaBoard.com запрещено.