23
Мы делаем мир понятным! XML и Microsoft .NET-решения для перевода документов Михаил Каничев Коммерческий директор Компания ПРОМТ

Мы делаем мир понятным!

  • Upload
    nevina

  • View
    27

  • Download
    0

Embed Size (px)

DESCRIPTION

XML и Microsoft .NET -решения для перевода документов. Мы делаем мир понятным!. Михаил Каничев Коммерческий директор Компания ПРОМТ. XML – новый технологии работы с документами. Что такое XML? Новый стандарт представления данных. - PowerPoint PPT Presentation

Citation preview

Page 1: Мы делаем мир понятным!

Мы делаем мир понятным!

XML и Microsoft .NET-решения для перевода документов

Михаил Каничев

Коммерческий директор Компания ПРОМТ

Page 2: Мы делаем мир понятным!

XML – новый технологии работы с документами

Что такое XML?

Новый стандарт представления данных.

XML –спецификации (набор правил), позволяющие создавать свои собственные языки для описания собственных данных.

Существует множество подобных языков базирующихся на XML и любая организация может создать их для своих целей

XML обеспечивает достижения следующих целей:

Page 3: Мы делаем мир понятным!

XML – новые технология работы с документами

Цели достигаемые XML:

• Расширяемость

• Структурность

• Разделение текстового контента и форматной информации

• Легкость интерпретации

Page 4: Мы делаем мир понятным!

XML – новый технологии работы с документами

Что обеспечивает XML?

Интеграцию данных из разных источников

Снижает затраты на хранение и обслуживание хранилищ документов.

Возможность эффективной передачи через Сеть

Независимость от платформ

Page 5: Мы делаем мир понятным!

Что такое перевод XML?

Мы не говорим и переводе XML, мы говорим о:

переводе документа, подготовленного с использованием языка основанного на XML.

возможности перевода контента, кастомизации параметров перевода и получения выходного документа в соответствии с правилами языка базирующегося на XML.

Page 6: Мы делаем мир понятным!

Что такое перевод XML?

Что такое XML с точки зрения машинного перевода?

XML документ есть текстовый файл содержащий два типа информации:

1. Структурная информация (XML тэги)

2. Контент (информация между тэгами)

• Оставить первое без изменений

• Выделить и перевести Контент.

• Поставить тэги в перевод

Система МП должна:

Page 7: Мы делаем мир понятным!

Как переводить контент?

Вот что должна решать система МП

Что такое перевод XML?

Или другими словами:

• Какое направление перевода использовать

• Какие словари использовать

• Какие слова не переводить

• Какие слова транслитерировать

• И т.д....

Page 8: Мы делаем мир понятным!

Решение для перевода XML

PROMT XML Translation Server (PXML) решение для перевода документов в формате XML.

ПРОМТ представляет

PXML (Tamino Edition) PXML (XBRL Edition)

Основа всех решении – модуль перевода TransSGML

Page 9: Мы делаем мир понятным!

1. Решение для перевода XML

TransXML

Редактор правил

Исходный XMLдокумент

Переведенный XMLдокумент

Translation kernel

Базовая схема работы PROMT XML Translation Server

Формирование правил перевода XML

Page 10: Мы делаем мир понятным!

1. Решение для перевода XML

Преимущества обеспечиваемые XML

слова не требующие перевода, словари используемые для перевода, необходимость транслитерации

возможность выделения в исходном тексте специальной информации:

Page 11: Мы делаем мир понятным!

1. Решение для перевода XML

Преимущества PXML

Легкая и удобная интеграции PXML в любую корпоративную систему, основой которой является хранение и передача данных в формате XML

Возможность создания реализаций для различных XML-форматов и систем

Page 12: Мы делаем мир понятным!

1. Решение для перевода XML

Запрос HTTP Клиента

Ответ PXTS : переведенный XML - документ

Запрос переведенный PXTS

Ответ HTTP сервера : xml-документ

XML клиент

XML сервер

PXTS

Page 13: Мы делаем мир понятным!

1.а. Решение для Tamino XML Server

PXML (Tamino Edition) -- первая реализация на основе платформы PXML:

Интеграция с Tamino XML Server Перевод XML-документов

«на лету» по запросу пользователя Мощная и удобная функция

перевода

Page 14: Мы делаем мир понятным!

PXML (XBRL Edition) – решение для перевода XBRL-документов.

1 б. Реализация для перевода XBRL

Обеспечивает мгновенный доступ к деловой и финансовой информации на иностранных языках.

Page 15: Мы делаем мир понятным!

1 б. Реализация для перевода XBRL

XBRL – extensible business report language

XBRL - новый стандарт для деловых отчетов, созданный на основе XML (www.xbrl.org),. хорошо документирован публичный поддерживается крупнейшими мировыми компаниями.

Page 16: Мы делаем мир понятным!

Клиент

Excel Investor’s Assistant

PXTS client proxy

Server side – http://www.nasdaq.com/xbrlws/

PXTSPXTS/NASDAQ

connectorPXTS XML Translator

1 б. Реализация для перевода XBRL

Page 17: Мы делаем мир понятным!

2. Решение для платформы Microsoft .NET

Что такое Microsoft .NET?

Это объединяющая платформа для распределенных приложений и сервисов.

Что такое WebService.NET?

Любая программа может обратиться к ресурсу сети, чтобы:

Получить в XML формате информацию какие функции доступны

Обратиться к этим функциям

Page 18: Мы делаем мир понятным!

2. Решение для платформы Microsoft .NET

Что обеспечивает Microsoft .NET решение?

Удобство - доступ к сервисам/приложениям с любого рабочего места;

Экономия - возможность аренды приложений на короткий срок

Page 19: Мы делаем мир понятным!

Пример реализации.

Совместный проект.

Microsoft Доступ к MSDN ( .Net Framework SDK)

Гарант-Парк Хостинг сервера переводов

(www.godotnet.ru)

ПРОМТ PROMT WebService (специальная

настройка)

2. Решение для платформы Microsoft .NET

Page 20: Мы делаем мир понятным!

Общая схема

2. Решение для платформы Microsoft .NET

Msdn.microsoft.com/library

www.gotdotnet.ru

пользователь

Оригинальнаястраница

Переведеннаястраница

Выделение HTML текстадля перевода

Подготовка переведеннойстраницы для представления

пользователю

Page 21: Мы делаем мир понятным!

Обработка информации в PROMT Web Service

2. Решение для платформы Microsoft .NET

Модуль специальной предобработкистраниц формата MSDN (анализ

страницы и выделение фрагментов,не требующих перевода)

Модуль перевода HTML (разбор HTML, выделение текста для перевода, конструирование переведенной страницы)

Модуль перевода с английского на русский язык. Перевод осуществляется с использованием специально

разработанной словарной базы, содержащей терминологию,используемую в документах MSDN

Специальная словарная база

PR

OM

T M

SD

N O

nli

ne

Tra

nsl

atio

n .N

et W

eb с

ерви

с

Page 22: Мы делаем мир понятным!

PROMT Web Service

Результат использования

Количество прочитанныхСтраниц, полученных с помощью PROMT WebService

Февраль около 100 стр. в деньМарт около 900 стр. в день

Рост за месяц на порядок

Оценка пользователей 3,8-3,9 из 5

Page 23: Мы делаем мир понятным!

Компания ПРОМТ

www.PROMT.ru

www.Translate.ru

www.PROMT.ru

www.Translate.ru

Санкт-ПетербургСанкт-Петербург

Тел.: (812) 327-4425Тел.: (812) 327-4425