Навигация
Навигация
Главная
Сайт МГЛУ
Об университете
Наш чат
Форум
Веб-ссылки
Контакт
Поиск
Лучшее на сайте

Фотоальбомы

Библиотека
Новости

Фотоальбомы

Библиотека
Статьи

Фотоальбомы

Библиотека
Изба-читальня
Интересные факты
Афоризмы
Анекдоты

Download

Выпускники
Список выпускников
Список преподавателей
На Википедии
Разыскиваются...

Сотрудничество

О сайте
Последние статьи
Слон залез на дерево
Страны, где придется учить сотни языков...
Суровая правда о жизни в Европе, глазами эмигрантов...
Мы редко улыбаемся? И правильно делаем!...
Белая раса находится под угрозой исчезновения...
Можно ли забыть родной язык?
Автограф для брестской «Зари» от менеджера Beatles, Селин Дион и Ти...
Живут же люди! Квартал «космических» домов в Голландии...
Путешествие в рай битломана: музей «Битлз» в Голландии...
Легко ли найти Ждуна у него на родине?
«Квартиры здесь обычно не больше комнаты в общаге»...
Минусы жизни в США
Что мы знаем о своем мозге?
Проблемы перевода языка инопланетян
Сестра из Парижа
Интересный факт
Согласно «Частотному словарю русского языка» под ред. Л. Н. Засориной, наиболее употребительными являются ок. 30 тыс. слов, а наибольшую частоту имеют чуть более 6 тысяч слов, покрывающих более 90% обработанных при составлении словаря текстов.

По современным оценкам, словарный запас учащегося первого класса средней школы составляет 2000 слов. Человек с высшим образованием знает порядка 10 тыс. слов, эрудиты — до 50 тыс. слов.

«Словарь языка Пушкина», содержащий используемые классиком слова, содержит более 20 тыс. слов, словарь языка В. И. Ленина — более 37 тыс. слов.
Google
Как это работает: машинный перевод иноязычных текстов
ПО и железо7 января 1954 года в штаб-квартире корпорации IBM в Нью-Йорке состоялся так называемый «Джорджтаунский эксперимент», в ходе которого был успешно продемонстрирован полностью автоматический перевод нескольких десятков предложений с русского языка на английский.

Перевод был примитивным: на основе словаря из 250 слов и 6 правил. Поэтому система могла перевести только несколько самых примитивных фраз. Но целью было привлечь внимания к машинному переводу и продемонстрировать его перспективность.

Теперь, благодаря интернету, каждое незнакомое слово или фразу можно за несколько секунд перевести на родной язык, и этот перевод получится довольно точный. Что же изменилось с тех пор? Какой сейчас принцип работы автоматических переводчиков и какое будущее у живых переводчиков-профессионалов?

Современные онлайн-переводчики (самый известный из которых — Google Translate) используют статистический машинный перевод, в процессе которого компьютерная программа анализирует огромный массив текстов, переведенных людьми, использует словари и грамматику в цифровом формате. Звучит сложно? Давайте разбираться.
Огромный массив текстов состоит из большого количества языковых пар — текстов, которые имеют две точные языковые версии (переведенные человеком). В качестве таких текстов обычно используются официальные документы мультиязычных стран, где перевод документации обязателен на все государственные языки. Такие переводы всегда совершенны, так как государственные документы решают судьбу отдельных людей и страны в целом. Очень полезными оказались и многоязычные документы, выпускаемые ООН.

Анализируя пары текстов, система «учится», усваивая с каждым разом все больше новых правил. Таким образом строится модель языка.

Каждая система автоматического перевода имеет модель перевода — «словарь», в котором для всех слов и фраз на одном языке перечислены возможные переводы на другой язык с указанием вероятности этих переводов. Модели перевода для каждой пары языков содержат миллионы пар слов и словосочетаний.

Если вы переводите с английского языка, например, на белорусский, будут задействованы две языковые пары: белорусский-русский и русский-английский. То есть сначала текст переводится с английского на русский, а потом — с русского на белорусский.

Такой путь наиболее рационален, так как документов, которые бы имели безукоризненные английскую и белорусскую версии — немного, и прямой перевод с английского на белорусский получался бы очень некачественным по причине недостаточной «обученности» системы.

Непосредственно переводом занимается декодер — алгоритм, который проводит анализ текста и для каждого слова подбирает все варианты перевода, упорядочивая в порядке убывания вероятности. Затем все полученные варианты декодер оценивает с помощью модели языка на частотность употребления и выбирает предложение с лучшим сочетанием вероятности и частотности.

К сожалению, в настоящее время нет сервиса автоматического перевода, который бы мог перевести текст с такой же точностью, как и человек-переводчик. Но уже сейчас некоторые компании внедряют в машинный перевод нейронные сети, которые значительно улучшают его качество.

Поэтому можно предположить, что с течением времени специалисты-переводчики будут нужны только для создания сложных художественных переводов, что значительно сократит численность людей, занятых в этой сфере. Но вряд ли это близкая перспектива.

nn.by
admin 10.11.2017 12:05 · Для печати
Комментарии
Нет комментариев
Добавить комментарий
Пожалуйста, зайдите на сайт для добавления комментария.
Рейтинг
Рейтинг доступен только для зарегистрированных пользователей.

Для участия в голосовании по рейтингу, пожалуйста, зайдите на сайт через форму входа или зарегистрируйтесь.

Нет данных для оценки
Гость
Имя пользователя:

Пароль:

 Запомнить меня! 


Забыли пароль?
Запросите новый
С Днем рождения!
  ЦАРИКОВ Иван

Календарь событий
ПнВтСрЧтПтСбВс
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31

Случайный анекдот
— К как по-английски будет гоголь-моголь?
— Шекспир-мекспир!
Афоризм
--------------
Counter