Навигация
Навигация
Главная
Сайт МГЛУ
Об университете
Наш чат
Форум
Веб-ссылки
Контакт
Поиск
Лучшее на сайте

Фотоальбомы

Библиотека
Новости

Фотоальбомы

Библиотека
Статьи

Фотоальбомы

Библиотека
Изба-читальня
Интересные факты
Афоризмы
Анекдоты

Download

Выпускники
Список выпускников
Список преподавателей
На Википедии
Разыскиваются...

Сотрудничество

О сайте
Последние статьи
Слон залез на дерево
Страны, где придется учить сотни языков...
Суровая правда о жизни в Европе, глазами эмигрантов...
Мы редко улыбаемся? И правильно делаем!...
Белая раса находится под угрозой исчезновения...
Можно ли забыть родной язык?
Автограф для брестской «Зари» от менеджера Beatles, Селин Дион и Ти...
Живут же люди! Квартал «космических» домов в Голландии...
Путешествие в рай битломана: музей «Битлз» в Голландии...
Легко ли найти Ждуна у него на родине?
«Квартиры здесь обычно не больше комнаты в общаге»...
Минусы жизни в США
Что мы знаем о своем мозге?
Проблемы перевода языка инопланетян
Сестра из Парижа
Интересный факт
По числу производимых фильмов в год США и Голливуд в частности занимают только третье место в мире. На втором месте — так называемый Нолливуд, кинематограф Нигерии, а лидирует индийская киноиндустрия, которую часто именуют Болливудом.
Google
Как это работает: машинный перевод иноязычных текстов
ПО и железо7 января 1954 года в штаб-квартире корпорации IBM в Нью-Йорке состоялся так называемый «Джорджтаунский эксперимент», в ходе которого был успешно продемонстрирован полностью автоматический перевод нескольких десятков предложений с русского языка на английский.

Перевод был примитивным: на основе словаря из 250 слов и 6 правил. Поэтому система могла перевести только несколько самых примитивных фраз. Но целью было привлечь внимания к машинному переводу и продемонстрировать его перспективность.

Теперь, благодаря интернету, каждое незнакомое слово или фразу можно за несколько секунд перевести на родной язык, и этот перевод получится довольно точный. Что же изменилось с тех пор? Какой сейчас принцип работы автоматических переводчиков и какое будущее у живых переводчиков-профессионалов?

Современные онлайн-переводчики (самый известный из которых — Google Translate) используют статистический машинный перевод, в процессе которого компьютерная программа анализирует огромный массив текстов, переведенных людьми, использует словари и грамматику в цифровом формате. Звучит сложно? Давайте разбираться.
Огромный массив текстов состоит из большого количества языковых пар — текстов, которые имеют две точные языковые версии (переведенные человеком). В качестве таких текстов обычно используются официальные документы мультиязычных стран, где перевод документации обязателен на все государственные языки. Такие переводы всегда совершенны, так как государственные документы решают судьбу отдельных людей и страны в целом. Очень полезными оказались и многоязычные документы, выпускаемые ООН.

Анализируя пары текстов, система «учится», усваивая с каждым разом все больше новых правил. Таким образом строится модель языка.

Каждая система автоматического перевода имеет модель перевода — «словарь», в котором для всех слов и фраз на одном языке перечислены возможные переводы на другой язык с указанием вероятности этих переводов. Модели перевода для каждой пары языков содержат миллионы пар слов и словосочетаний.

Если вы переводите с английского языка, например, на белорусский, будут задействованы две языковые пары: белорусский-русский и русский-английский. То есть сначала текст переводится с английского на русский, а потом — с русского на белорусский.

Такой путь наиболее рационален, так как документов, которые бы имели безукоризненные английскую и белорусскую версии — немного, и прямой перевод с английского на белорусский получался бы очень некачественным по причине недостаточной «обученности» системы.

Непосредственно переводом занимается декодер — алгоритм, который проводит анализ текста и для каждого слова подбирает все варианты перевода, упорядочивая в порядке убывания вероятности. Затем все полученные варианты декодер оценивает с помощью модели языка на частотность употребления и выбирает предложение с лучшим сочетанием вероятности и частотности.

К сожалению, в настоящее время нет сервиса автоматического перевода, который бы мог перевести текст с такой же точностью, как и человек-переводчик. Но уже сейчас некоторые компании внедряют в машинный перевод нейронные сети, которые значительно улучшают его качество.

Поэтому можно предположить, что с течением времени специалисты-переводчики будут нужны только для создания сложных художественных переводов, что значительно сократит численность людей, занятых в этой сфере. Но вряд ли это близкая перспектива.

nn.by
admin 10.11.2017 12:05 · Для печати
Комментарии
Нет комментариев
Добавить комментарий
Пожалуйста, зайдите на сайт для добавления комментария.
Рейтинг
Рейтинг доступен только для зарегистрированных пользователей.

Для участия в голосовании по рейтингу, пожалуйста, зайдите на сайт через форму входа или зарегистрируйтесь.

Нет данных для оценки
Гость
Имя пользователя:

Пароль:

 Запомнить меня! 


Забыли пароль?
Запросите новый
С Днем рождения!
  ЛУКАШИК Михаил

Календарь событий
ПнВтСрЧтПтСбВс
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

Случайный анекдот
Русский, французский и китайский лингвисты решили написать имена друг друга, каждый на своём языке.

— Моя фамилия Ге, — сказал француз китайцу.
— В китайском языке два иероглифа Ге, но, к сожалению, ни один из них не подходит для фамилии.
— Почему?
— Потому что один имеет значение «колесо», а другой передает звук, с которым лопается мочевой пузырь осла.
— А что плохого в колесе?
— Мужское имя не может быть круглым. Для твоего имени мы возьмем иероглиф Шэ, означающий «клавиатура», «корнеплод», «страница», а также прилагательное «бесснежный» и дополним его иероглифом Нгу, означающим мужской род. В конце я пишу иероглиф Мо — «девственный».
— Но это, мягко говоря, не совсем…
— Никто не будет считать тебя девственником, просто без иероглифа Мо иероглифы Ше-Нгу означают «сбривающий мамины усы».

— Хорошо, теперь я напишу твое имя.
— Моя фамилия Го.
— Отлично, я начну твою фамилию с буквы G.
— Что означает буква G?
— У нас, европейцев, сами по себе буквы ничего не значат, но чтобы проявить к тебе уважение, я поставлю перед G букву H — во французском она все равно не читается.
— Отлично! Дальше O?
— Нет, чтобы показать, что G — произносится как Г, а не как Х, надо после G поставить букву U, а также H — чтобы показать, что U не читается сама по себе, а только показывает, как правильно читать G, и буквы EY, показывающие, что слово не длинное и скоро закончится.
— Hguhey… дальше O?
— Нет, О во французском произносится как А или Ё, в зависимости от стоящих по соседству букв, ударения и времени года. Твое чистое О записывается как AUGHT, но слово не может кончаться на T, поэтому я добавлю нечитаемое окончание NGER. Вуаля!

Русский лингвист поставил бокал на стол, взял листочек и написал «Го» и «Ге».
— И всё?
— Да.

Француз с китайцем почесали в затылке.
— Хорошо, а какая у тебя фамилия?
— Щекочихин-Крестовоздвиженский.
— А давайте просто выпьем? — первым нашёлся китаец.

Русский кивнул и француз с облегчением поднял тост за шипящие дифтонги.
Афоризм
Английский — простой, но очень трудный язык. Он состоит из одних иностранных слов, которые к тому же неправильно произносятся. (Курт Тухольский)
Counter