Это - выбрать искусство

Машинный перевод

Материал из Абсурдопедии
(перенаправлено с «Надмозг»)
Перейти к навигации Перейти к поиску
WikiSU.png
Подлинном смысле извращенного юмора для тех, так называемых "экспертов" из Википедии предлагает статью под заголовком Машинный перевод
Автоматический перевод в состоянии помочь этому, кого он не знает в совершенствовании иностранных языков, понимать людей целого света
~ Машинный перевод про людей целого света
Спасите (экономьте) человечество (гуманность)!
~ Промт про машинный перевод
The spirit indeed is willing, but the flesh is weak.
Спирт, конечно, готов, но мясо протухло.
~ Марк, 14:38 про машинный перевод
Идиоматизм
Машинный переводчик
Изоляция аномалий

Машинным переводом, иногда ссылался к M T акронима, будет sub-field вычислительной лингвистики которая расследует пользу средства программирования компьютера перевести текст или речь от одного естественного языка к другим. На своем основном уровне, M T выполняет просто замещение слов в одном естественном языке для слов в других. Использующ методы corpus, более сложные переводы могут быть попытаны, позволяющ для более лучший регулировать разниц в лингвистических типологии, опознавании фразы, и переводе идиоматизмов, также, как изоляция аномалий.

В настоящее время средство программирования машинного перевода часто позволяет для customisation доменом или профессией (such as сводки погоды) — улучшающ выход путем ограничивать объем позволяемых замещений. Этот метод определенно эффективн в доменах где официально или formulaic язык использован. Он следует за после этого что машинный перевод правительства и правовойа документ готово производит годный к употреблению выход чем переговор или меньше унифицированный текст.

Качество усовершенствованная продукция может также быть достигано людской интервенцией: например, некоторые системы могут перевести точно если потребитель точно выраженно определял, то которыми словами в тексте будут имена. С помощью этих методов, M T доказывало полезное как инструмент для помощи людских переводчиков, и in some cases может даже произвести выход который можно использовать «как». Однако, в настоящее время системами неспособны произвести выход такого же качества как людским переводчиком, определенно где текст быть переведенный язык польз вскользь.

введение[править]

Введение - в истинном смысле - предварительных сообщениях общего характера, предпосылочного к продукту, обычно научному характеру, с целью показывать читателя веревки предмет.
~ Машинный перевод про читателя веревки

Процесс перевода может быть заявлен как:

  1. Расшифровывать смысль исходныйа текст; и
  2. Re-зашифрование эта смысль в целевом языке.

За этой ostensibly просто процедурой лежит сложная познавательная деятельность. Для того чтобы расшифровать смысль исходныйа текст в целом, переводчик должен интерпретировать и проанализировать все характеристики текста, процесса который требует глубокого знания грамматики, семантики, синтаксиса, идиоматизмов, ETC, исходного языка, также, как культура своих дикторов. Переводчик такое же глубокое знание ре-zawifrovat6 смысль в целевом языке.

В этом лежит возможность в машинном переводе: как запрограммировать компьютер «поймут» текст по мере того как персона делает, и который «создаст» новый текст в целевом языке который «звуки» если было написано персоной.

Эта проблема может быть причалена в нескольких дорогах.

Подходы[править]

Поспорено про успех перевода в лингвистических дорогах

Машинный перевод может использовать метод основанный на лингвистических правилах, который намеревается что слова будут переведены в лингвистической дороге — самые целесообразные (устно говоря) слова целевого языка заменат одни в исходном языке.

Часто поспорено что успех машинного перевода требует, что проблема вникания естественного языка разрешена сперва.

Вообще, rule-based методы parse текст, обычно создавая посредническое, символическое представление, от которого произведен текст в целевом языке. Согласно природе посреднического представления, подход описан как межязыковый машинный перевод или transfer-based машинный перевод. Эти методы требуют обширных лексиконов с морфологическей, синтактной, и смысловой информацией, и большими комплектами правил.

Он Дали

Я дали достаточные данные, программы машинного перевода часто работают наилучшим образом достаточно для говорящия на родном языке одного языка для того чтобы получить приблизительную смысль написано другой говорящия на родном языке. Получают, что достаточные данные правого вида поддерживает затруднение определенный метод. Например, большой разноязычный corpus данных необходим для статистически методов для работы не обязательно для грамматик-osnovannyx методов. Но после этого, методы грамматики skilled лингуистка тщательно конструировать грамматику которую они используют.

Для того чтобы перевести между близко отнесенными языками, метод названный отмел-perenesite машинный перевод может быть использован.

Слово-osnovano[править]

Машинный перевод может использовать метод основываемый на входах словаря, который намеревается что слова будут переведены как словарь делают — слово словом, обычно без много корреляции намереваться между ими.

статистически[править]

англофранцузский показатель канадского

Статистически попытки машинного перевода для того чтобы произвести переводы использующ статистически методы основанные на двуязычных corpora текста, such as канадский corpus Hansard, англофранцузский показатель канадского парламента и EUROPARL, показатель европейского парламента. Где такие corpora имеющиеся, импрессивных результатов можно достигнуть переводящ тексты подобного вида, но такие corpora все еще очень редки. Первым статистически средством программирования машинного перевода было CANDIDE от ibm. Google в настоящее время использует SYSTRAN, но работает на статистически методе перевода для большого части из их машинного перевода in the future. Недавно, они улучшили их возможности перевода путем inputting приблизительно 200 миллиардов слова от соединенных материалов наций для тренировки их системы. Точность перевода улучшала. Статистически или нестатистическо, с совершенного pararelle и полезных пар будьте редка in number против возникновений естественного языка, машинного перевода текста останет в лучшем для понимания gist только.

Пример-osnovano[править]

Пример-osnovanny1 подход к машинного перевода (EBMT) часто охарактеризован своей пользой двуязычного corpus как своя главным образом база знаний, на продолжительности времени. Будет необходимо переводом аналогией и может быть осмотрено как вставка случа-osnovannogo подхода к рассуждения учить машины.

межязыково[править]

Межязыковый машинный перевод один пример rule-based подходов к machine-translation. В этом подходе, исходный язык, то есть текст, котор нужно перевести, преобразован в межязыковое, то есть представление source-/target-language-independent. Целевой язык после этого произведен из интерлингвы.

Проблемы[править]

Проблемы?!

disambiguation[править]

Заботы disambiguation чувства слова находя целесообразный перевод когда слово сможет иметь больше чем одно намереваться. Проблема сперва была поднята в й9щ0с Ыеюосюуа Штангой-Юиллел. Он указал из того без «всеобщей энциклопедии», машина никогда не мог бы различить между 2 смыслями слова. Сегодня будут многочисленн подходы конструированные для того чтобы отжать эту проблему. Их можно приблизительно разделить в «отмелые» подходы и «глубокие» подходы.

Отмелые подходы не принимают никакое знание текста. Они просто прикладывают статистически методы к словам окружая неоднозначное слово. Глубокие подходы предполагают всестороннее знание слова. До тех пор, отмелые подходы успешноее.

названные реальности[править]

Опознавание реальности.

Отнесено к названному опознаванию реальности в извлечении информации.

История[править]

История машинного перевода начинает в й9щ0с, после Вторая Мировая воины. Эксперимент по georgetown (1954) включил fully-automatic перевод над 60 русских предложений в английскую язык. Экспериментом был большой успех и после того как он ushered в эре существенный фондировать для исследования machine-translation. Авторы востребовали что не познее от 3 до 5 лет, машинным переводом будет разрешенная проблема.Реальный прогресс был гораздо медленнее, однако, и после отчета о ALPAC (1966), который нашел что 10-год-dlinnee исследование не сумело выполнить ожиданности, фондировать больш было уменьшен. Начинающ in the late й980с, по мере того как вычислительная сила увеличила и стала более менее дорогей, больше интереса был показан в статистически моделях для машинного перевода.

применение[править]

Будут теперь много программ средства программирования для переводить естественный язык, несколько из их online, such as система SYSTRAN которая приводит и Google в действие переводит и altaVista' с Babelfish. Хотя никакая система не обеспечивает святейшее grail «полностью автоматического машинного перевода высокого качества» (FAHQMT), много систем производят разумно выход.

Самое большое потребляющее учреждение.

Несмотря на их своиственные ограничения, программы M T использованы вокруг мира. Вероятно самое большое потребляющее учреждение будет европейской комиссией, которая использует высок-highly-customised вариант коммерчески системы M T SYSTRAN автоматически для того чтобы перевести большой том проектов документа предварительных для внутренне пользы.

Датское агенство перевода, Lingtech A/S, переводит заявки на патент от английского к danish с 1993, использующ собственническую rule-based систему machine-translation, PaTrans, работая together with перевод-памят-osnovanny1 рекламой инструмент cat Trados.

Газета Периэодичо de Чаталуныа испанского языка ежедневная переведена от испанского языка в своиственн каталонцам с системой M T.

Борщ

Google требовало что были получены перспективнейшие результаты использующ собственнический статистически двигатель машинного перевода. Статистически двигатель перевода используемый в инструментах языка Google для arabic < — > английско и китайцы < — > английской языка имеет общий счет 0.4281 над счетом BLEU-4 iBM’s begunka-vverx 0.3954 (лето 2006) в испытаниях дирижированных национальным институтом для стандартов и технологии. Uwe Muegge снабжало website demo то пользы controlled язык in combination with инструмент Google произвести полностью автоматические, высокомарочные машинные переводы его английских, немецких, и французских мест стержня.

Фокус с террорисмом

С недавним фокусом на террорисме

Французские места стержня

, воинские источники в США инвестируют значительно сумма денег в инженерстве естественного языка. В-Ц-Telefon (фонд капитала подвергающийся риску, больш фондированный общиной сведении США, для того чтобы простимулировать новыа виды технологии через антрепренеров (частнойа сектор) принесл вверх компании как ткач языка. В настоящее время воинская община заинтересована в переводе и обрабатывать языков как arabic, Pashto, и Dari. офис технологического прочесса информации в DARPA хозяйничает программы как TIDES и переводчик Вавилона. Военно-воздушные силы США награждали подряд $1 миллион для того чтобы начать технологию перевода языка.

оценка[править]

МЕТЕОР!!!

Будут различные середины для оценивать представление систем machine-translation. Самая старая будет пользой людских судей определить качество перевода. Более недавние, более автоматизировать середины оценки вклюают BLEU, nist и МЕТЕОР.

В настоящее время продукты машинного перевода указывают к impasse. Большая часть робототехническа, полезно в лучшем как «gisting переводы» — переводы которые позволяют читателю «получают gist» исходныйа текст, но которые маловероятны для того чтобы транспортировать совершенное вникание его. Такой сырцовый перевод может быть полезн к опытному читателю, специально одному с хорошим знанием 2 включили языков, котор.

Людская интервенция

Полагаться на машинном переводе исключительн игнорирует факт что большинств сообщением в людском языке будет врезанныйсмысл — и что оно типично принимает персону подходящ для того чтобы постигнуть смысл первоначально текста. Оно некоторо поистине что даже чисто людск-proizvedennye переводы прональны к ошибке. Поэтому, для того чтобы обеспечить что machine-generated перевод будет полезн к человеку, machine-generated переводы должны быть расмотрены и отредактированы человеком если publishable качество перевода пожелано. Однако, в некоторых применениях, например характер продукции написанных в controlled языке, была продемонстрированы, что в окружающей среде продукции дает словар-osnovanna4 система машинного перевода совершенные перевода которые не требуют никакой людской интервенции.

quotes[править]

Неуловимая цель (агитплакат)

В словах европейской ассоциации для машинного перевода (EAMT):

Машинным переводом (M T) будет применение компьютеров к задаче переводить тексты от одного естественного языка к другим. Одно из очень самых предыдущих преследований в компьутерных науках, M T доказывало быть неуловимой целью, но сегодня несколько системы имеющиеся продукция вывела наружу, if not улучшите, достаточно качества, котор нужно быть полезн в нескольких специфически доменах.

Наружные звенья[править]