Последние статьи
|
|
|
|
Интересный факт
|
|
6 декабря 1957 года, через два месяца после запуска первого в истории советского спутника, американцы попытались запустить свой аппарат Vanguard TV3. Через две секунды после старта ракета взорвалась. Эта неудача была жёстко раскритикована американскими газетами, придумавшими для аппарата множество неологизмов на основе слова «спутник», включая «упсник» и «капутник». А спустя несколько дней советский представитель в ООН участливо поинтересовался у американского коллеги, не нуждаются ли США в гуманитарной помощи, выделяемой СССР для неразвитых стран. |
|
|
Google
|
|
|
|
|
Как это работает: машинный перевод иноязычных текстов |
7 января 1954 года в штаб-квартире корпорации IBM в Нью-Йорке состоялся так называемый «Джорджтаунский эксперимент», в ходе которого был успешно продемонстрирован полностью автоматический перевод нескольких десятков предложений с русского языка на английский.
Перевод был примитивным: на основе словаря из 250 слов и 6 правил. Поэтому система могла перевести только несколько самых примитивных фраз. Но целью было привлечь внимания к машинному переводу и продемонстрировать его перспективность.
Теперь, благодаря интернету, каждое незнакомое слово или фразу можно за несколько секунд перевести на родной язык, и этот перевод получится довольно точный. Что же изменилось с тех пор? Какой сейчас принцип работы автоматических переводчиков и какое будущее у живых переводчиков-профессионалов?
Современные онлайн-переводчики (самый известный из которых — Google Translate) используют статистический машинный перевод, в процессе которого компьютерная программа анализирует огромный массив текстов, переведенных людьми, использует словари и грамматику в цифровом формате. Звучит сложно? Давайте разбираться.
Огромный массив текстов состоит из большого количества языковых пар — текстов, которые имеют две точные языковые версии (переведенные человеком). В качестве таких текстов обычно используются официальные документы мультиязычных стран, где перевод документации обязателен на все государственные языки. Такие переводы всегда совершенны, так как государственные документы решают судьбу отдельных людей и страны в целом. Очень полезными оказались и многоязычные документы, выпускаемые ООН.
Анализируя пары текстов, система «учится», усваивая с каждым разом все больше новых правил. Таким образом строится модель языка.
Каждая система автоматического перевода имеет модель перевода — «словарь», в котором для всех слов и фраз на одном языке перечислены возможные переводы на другой язык с указанием вероятности этих переводов. Модели перевода для каждой пары языков содержат миллионы пар слов и словосочетаний.
Если вы переводите с английского языка, например, на белорусский, будут задействованы две языковые пары: белорусский-русский и русский-английский. То есть сначала текст переводится с английского на русский, а потом — с русского на белорусский.
Такой путь наиболее рационален, так как документов, которые бы имели безукоризненные английскую и белорусскую версии — немного, и прямой перевод с английского на белорусский получался бы очень некачественным по причине недостаточной «обученности» системы.
Непосредственно переводом занимается декодер — алгоритм, который проводит анализ текста и для каждого слова подбирает все варианты перевода, упорядочивая в порядке убывания вероятности. Затем все полученные варианты декодер оценивает с помощью модели языка на частотность употребления и выбирает предложение с лучшим сочетанием вероятности и частотности.
К сожалению, в настоящее время нет сервиса автоматического перевода, который бы мог перевести текст с такой же точностью, как и человек-переводчик. Но уже сейчас некоторые компании внедряют в машинный перевод нейронные сети, которые значительно улучшают его качество.
Поэтому можно предположить, что с течением времени специалисты-переводчики будут нужны только для создания сложных художественных переводов, что значительно сократит численность людей, занятых в этой сфере. Но вряд ли это близкая перспектива.
nn.by
|
admin 10.11.2017 12:05 ·
|
|
Комментарии
|
Нет комментариев
|
|
Добавить комментарий
|
Пожалуйста, зайдите на сайт для добавления комментария.
|
|
Рейтинг
|
Рейтинг доступен только для зарегистрированных пользователей.
Для участия в голосовании по рейтингу, пожалуйста, зайдите на сайт через форму входа или зарегистрируйтесь.
Нет данных для оценки
|
|
|
Гость
|
|
Забыли пароль? Запросите новый
|
|
Календарь событий
|
|
|
|
Случайный анекдот
|
|
— Ей весело! Мы с матерью все больницы обзвонили, все физико-математические институты...
— Зачем физико-математические институты?
— Девочка! Да мало ли, куда тебя могло занести, мало ли что могло случиться! |
|
|
Афоризм
|
|
«Вы должны осознавать, что МГЛУ - это не курсы иностранного языка, а вуз, где вы получите классическое университетское образование требующее организованности и желания учиться. Мы можем научить любого, кто хочет учиться.»
Н. Копачева, декан факультета английского языка МГЛУ |
|
|
Counter
|
|
|
|
|