Языки и машинный перевод
    Сравнение электронных переводчиков
      Оценка качества машинного перевода
        Темы и онлайн-переводчики
          Алгоритм оценки качества машинного перевода, определение темы текста по содержанию.
          Последний наш перевод:
          "Экспортная таможенная декларация", Экспортные декларации, Переводчик №686
          Москва,
          ул. Большая Молчановка, 34 стр.2, оф. 25
          +7 495 504-71-35 с 9-30 до 17-30
          info@flarus.ru
          "Большое спасибо и за быстроту, и за качество перевода."
          ФГУП "Московский завод спецсплавов"

          Оценка качества машинного перевода

          Конечно, мы представляем себе абсурдность идеи автоматического определения качества машинного перевода, но мы нашли одно интересное решение.

          Первое, мы приняли за эталон перевод, выполненный профессиональным переводчиком (человеком).

          Второе, мы разработали алгоритм, вычисляющий зеркальную идентичность текстов - Translation Looks Like (TLL). TLL - это число, выраженное в процентах, 100% соответствует двум абсолютно идентичным текстам, 0% - означает, что тексты абсолютно разные.

          Третье, мы забыли о точных методах. Другими словами, сколько будет 2+2 - открытый вопрос. Мы применили принцип обучения системы оценки качества перевода и предложили ответить на этот вопрос человеку, который может, в общем-то, ответа не знать. Оценивая перевод "на глазок", мы получали некоторые числа (TLL) - которые послужили исходными данными для формализации процесса оценки качества перевода. Это число отображает лишь мнение человека, насколько хорош перевод, выполненный онлайн-переводчиком.

          Кратко об алгоритме вычисления TLL

          При оценке качества машинного перевода, каждому типу ошибки назначается вес в баллах или процентах. Подсчитывается общее кол-во баллов качества переведенного текста. При таком понимании процесса оценки качества машинных переводов, процедура сводится к выявлению ошибок в тексте и определению их типа.

          Использую алгоритм, мы получили наборы оценок каждого перевода и смогли провести статистическое исследование. Наше исследование показало, что если предложить эксперту оценить два разных набора текстов (оригинал-перевод), оказалось, что тот перевод, у которого TLL выше, большинству экспертов кажется более качественным.

          Кроме того, алгоритм позволяет определить набор частотных слов (меток) для каждого исходного текста и его перевода и сопоставить тему перевода с текстом. Найденные метки учитываются алгоритмом пропорционально их частотности. Задавая разные уровни отсечения меток, можно получить тематику текста (точнее, список тематик) и их вероятности связки с текстом.

          Мы упростили задачу, и брали только одну тему с наибольшей вероятностью связки с текстом машинного перевода. Как правило, небольшой объем текста и возникающие искажения текста при машинном переводе приводят в ошибке определения темы текста. Аналогичным образом мы определяли тему исходного текста.

          Новости переводов

          Как бюро переводов оценивает объем текста

          Чтение вслух положительно влияет на детей

          Выражение модальности

          Языки и машинный перевод | Сравнение электронных переводчиков | Оценка качества машинного перевода | Темы и онлайн-переводчики