Навигация
Навигация
Главная
Об университете
Сайт МГЛУ
Наш чат
Форум
Веб-ссылки
Контакт
Поиск
Лучшее на сайте

Библиотека
Новости
Статьи
Изба-читальня
Интересные факты
Афоризмы
Анекдоты

Фотоальбомы

Download

Выпускники
Список выпускников
Список преподавателей
На Википедии
Разыскиваются...

Сотрудничество

О сайте
Последние статьи
English to Become Official Language of the EU
Исследование: русские и украинцы оказались не славянами...
Конец конца Америки
Грустная повесть о Коморах, или острова, которым не повезло......
Махнем на Мадагаскар? Лемуры, баобабы — и много-много солнца... ...
5 вещей, которые в Англии лучше, чем в России...
5 вещей, которые в России лучше, чем в Англии...
Почему умницы и красавицы одиноки
Древний санскрит — это русский язык
Что случится после смерти королевы Великобритании...
Мы с супругой поехали в Париж. Больше такой ошибки мы уже никогда н...
Страны, где придется учить сотни языков...
«Звезда»... Без шума и фанфар
О напряжении в отношениях России и США
Ксеноглоссия — феномен внезапного овладения чужими языками...
Новые веб-ссылки
Жизнь в золотой клетке: 10 вещей, которые запрещено делать Кейт Миддлтон...
Честные истории о мужчинах и жизни
Наши в ОАЭ: "Ты в этой стране никто. Ты просто приехал сюда поработать, тебя "юзают"...
10 стереотипов из разных стран, которые оказались чистейшей правдой...
В Южной Африке до сих пор процветает каннибализм
7 вещей, из-за которых можно крупно влипнуть за границей...
Белорусы не смогут получать американские визы в посольствах США в России...
Феномен ксеноглоссии - Когда люди внезапно начинают разговаривать на неизвестных им языках...
Глобализация угрожает русскому научному языку
Парня не пустили в офис из-за шорт, но он вернулся в розовом платье и победил...
Ученые пытаются создать переводчик для общения с дельфинами...
Вся правда про жизнь в Китае из первых рук
Интересный факт
Филологи подсчитали, что в русском языке примерно 2000 слов тюркского происхождения. Из них около 300 обозначают предметы одежды и около 280 — еду и напитки.
Google
Как это работает: машинный перевод иноязычных текстов
ПО и железо7 января 1954 года в штаб-квартире корпорации IBM в Нью-Йорке состоялся так называемый «Джорджтаунский эксперимент», в ходе которого был успешно продемонстрирован полностью автоматический перевод нескольких десятков предложений с русского языка на английский.

Перевод был примитивным: на основе словаря из 250 слов и 6 правил. Поэтому система могла перевести только несколько самых примитивных фраз. Но целью было привлечь внимания к машинному переводу и продемонстрировать его перспективность.

Теперь, благодаря интернету, каждое незнакомое слово или фразу можно за несколько секунд перевести на родной язык, и этот перевод получится довольно точный. Что же изменилось с тех пор? Какой сейчас принцип работы автоматических переводчиков и какое будущее у живых переводчиков-профессионалов?

Современные онлайн-переводчики (самый известный из которых — Google Translate) используют статистический машинный перевод, в процессе которого компьютерная программа анализирует огромный массив текстов, переведенных людьми, использует словари и грамматику в цифровом формате. Звучит сложно? Давайте разбираться.
Огромный массив текстов состоит из большого количества языковых пар — текстов, которые имеют две точные языковые версии (переведенные человеком). В качестве таких текстов обычно используются официальные документы мультиязычных стран, где перевод документации обязателен на все государственные языки. Такие переводы всегда совершенны, так как государственные документы решают судьбу отдельных людей и страны в целом. Очень полезными оказались и многоязычные документы, выпускаемые ООН.

Анализируя пары текстов, система «учится», усваивая с каждым разом все больше новых правил. Таким образом строится модель языка.

Каждая система автоматического перевода имеет модель перевода — «словарь», в котором для всех слов и фраз на одном языке перечислены возможные переводы на другой язык с указанием вероятности этих переводов. Модели перевода для каждой пары языков содержат миллионы пар слов и словосочетаний.

Если вы переводите с английского языка, например, на белорусский, будут задействованы две языковые пары: белорусский-русский и русский-английский. То есть сначала текст переводится с английского на русский, а потом — с русского на белорусский.

Такой путь наиболее рационален, так как документов, которые бы имели безукоризненные английскую и белорусскую версии — немного, и прямой перевод с английского на белорусский получался бы очень некачественным по причине недостаточной «обученности» системы.

Непосредственно переводом занимается декодер — алгоритм, который проводит анализ текста и для каждого слова подбирает все варианты перевода, упорядочивая в порядке убывания вероятности. Затем все полученные варианты декодер оценивает с помощью модели языка на частотность употребления и выбирает предложение с лучшим сочетанием вероятности и частотности.

К сожалению, в настоящее время нет сервиса автоматического перевода, который бы мог перевести текст с такой же точностью, как и человек-переводчик. Но уже сейчас некоторые компании внедряют в машинный перевод нейронные сети, которые значительно улучшают его качество.

Поэтому можно предположить, что с течением времени специалисты-переводчики будут нужны только для создания сложных художественных переводов, что значительно сократит численность людей, занятых в этой сфере. Но вряд ли это близкая перспектива.

nn.by
admin 10.11.2017 12:05 · Для печати
Комментарии
Нет комментариев
Добавить комментарий
Пожалуйста, зайдите на сайт для добавления комментария.
Рейтинг
Рейтинг доступен только для зарегистрированных пользователей.

Для участия в голосовании по рейтингу, пожалуйста, зайдите на сайт через форму входа или зарегистрируйтесь.

Нет данных для оценки
Гость
Имя пользователя:

Пароль:

 Запомнить меня! 


Забыли пароль?
Запросите новый
С Днем рождения!
  ГЕРАСИМОВИЧ Сергей

Календарь событий
ПнВтСрЧтПтСбВс
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

В ближайшие 7 дней
-  13 – Родился С.Герасимович
-  15 – †А.Острога
-  18 – Международный день мигранта
-  19 – Родился С.Могилевцев

Сегодня родились:

НОВОЕ в скачивании
Леонид Володько. Третий мир?
Л. Володько - Margaritifera
Л.Володько - 1:1
Л.Володько - Санет Шэкспіра (Стамлёны ўсім...)
Л.Володько - Bo tak nie wolno żyć
Leo Volodko - Дорога милость
Leo Volodko - La merveilleuse (видео)
Вас невозможно научить иностранному языку
Случайный анекдот
Средневековый спам... Этак в XV веке стоит принц, ждет письма от любимой. Три дня и три ночи ждет.. Прилетает почтовый голубь. Принц, соответственно счастливый, быстренько пытается прочесть
присланное. А там «Кую мечи... Недорого».
Афоризм
Можно быть уверенным лишь в том, что ни в чем нельзя быть уверенным.
Counter