Upload
agencyleta
View
1.989
Download
3
Embed Size (px)
Citation preview
Новое информативное решение
Дигитализация Дигитализация содержаниясодержания
Возможность преобразовать печатные и отсканированные материалы в
информацию, легко поддающуюся классификации и электронному поиску
Что такое дигитализация содержания?Что такое дигитализация содержания?
1.
Сканиро-
вание /
импорт
1.
Сканиро-
вание /
импорт
2.Устано-вление рамок
страниц
2.Устано-вление рамок
страниц
3.Обработка элементов развертки страницы
3.Обработка элементов развертки страницы
4.Определение
номера страницы и
формирование структуры страницы
4.Определение
номера страницы и
формирование структуры страницы
5.Формиро
в-ание структуры
статей
5.Формиро
в-ание структуры
статей
6.Распозна
-вание
текста
6.Распозна
-вание
текста
7.Экспорт
7.Экспорт
Процесс дигитализацииПроцесс дигитализации
Этап 1. Сканирование/импортЭтап 1. Сканирование/импорт• Вид материала:
― газеты ― книги ― журналы ― буклеты ― прочее
• Тип материала: ― оригинальное изображение ― цифровое изображение ― микрофильмы ― прочее
Перед импортированием очень важно установить метаданные каждого документа, которые автоматически вводятся в программу.
Метаданные документа могут включать в себя:
Этап 2. Установление рамок страницы (VPF)Этап 2. Установление рамок страницы (VPF)
• Основные действия:― выпрямление страницы ― обрезание краев страницы
• Преимущества: ― возможность исправить ошибки,
допущенные во время сканирования:
▪ повернуть страницу в правильном направлении/наклоне
▪ обрезать черные края отсканированного документа
▪ разделить разворот на две ▪ части▪ и др.
Этап 3. Обработка элементов Этап 3. Обработка элементов развертки страниц (VLE)развертки страниц (VLE)
• Основные действия:― объединение или
перераспределение зон ― удаление ненужных зон ― определение типов зон
• Преимущества: ― возможность работать в
режиме Fullscreen― почти все действия
можно выполнять кнопками мыши и несколькими клавишами клавиатуры
Этап 4. Определение номеров Этап 4. Определение номеров страниц и формирование структуры страниц и формирование структуры
страницы (VPN&VPH)страницы (VPN&VPH) • Основные действия:
― определение номеров страниц― формирование структуры
страницы― определение даты, номера и
объема издания
• Преимущества: ― если в метаданные введена
правильная информация о конкретном издании, этот этап можно не выполнять
― возможность выявить недостающие в издании страницы
Этап 5. Формирование структуры Этап 5. Формирование структуры статьи (VH)статьи (VH)
• Основные действия: ― структурирование статей,
разделов издания― проверка, имеются ли у
изображений/таблиц соответствующие подписи
o Структура книг отличается от структуры газет.
• Преимущества: ― возможность исправить
ошибки, допущенные на предыдущих этапах
Этап 6. Распознавание текста (OCR)Этап 6. Распознавание текста (OCR)
• Основные действия: ― исправление текстов в
соответствующих типах зон
• Преимущества: ― возможность исправить любую
зону текста (заголовки, авторы, подписи к иллюстрациям и др.), если встроенная программа ABBYY распознает текст как ошибочный
― возможность заметить другой язык или тип шрифта (современный или фрактурный)
Этап 7. ЭкспортЭтап 7. Экспорт
• По запросу клиента программа автоматически экспортирует файлы в формате, указанном в спецификации
• Материалы для публикации в интернете ― Форматы файлов:
▪ JPEG, PNG, TIFF и др. ▪ PDF, structured PDF ▪ XML (mets, alto, mods и
др.)
Мы предлагаем свои услугиМы предлагаем свои услуги
• Библиотекам:―архив с удобной
системой поиска ―сохранение культурно-
исторического наследия в цифровой версии
―простое использование в интернете
• Издательствам:―архив с удобной
системой поиска ―повторное
использование содержания
―простое использование в интернете
―возможность для бизнеса – продажа содержания
Наш опытНаш опыт
• Дигитализация хранилищ Латвийской национальной библиотеки― период: июль 2010 года – июнь 2012 года ― объем: 1 562 500 книжных страниц, 2 750 000 страниц периодики ― суточное кол-во обрабатываемых страниц: 10 000 ― сотрудничество с разработчиком ПО – компанией CCS
• Дигитализация итальянской газеты LA STAMPA ― период: май 2009 года – март 2010 года― электронный архив за последние 120 лет ― 800 000 страниц ― сотрудничество с разработчиком ПО Zissor
• Медиа-мониторинг агентства LETA― действует с 2006 года ― ежемесячно сканируются и электронно обрабатываются более 30 000 страниц
изданий прессы ― сотрудничество с разработчиком ПО Zissor
Наши преимуществаНаши преимущества
• успешное сотрудничество с крупнейшими в Европе разработчиками ПО для дигитализации - Zissor, CCS
• профессиональная и высококвалифицированная команда из 50 человек
• конкурентоспособная ценовая политика
Ценовая политикаЦеновая политика
• Видео о ценах:- услуги сканирования; - услуги сегментирования; - создание портала для презентации
содержания:- приобретение всего пакета дигитализации.
Расценки на услуги - цена обработки одной страницы
устанавливается в зависимости от качества материала, кол-ва иллюстраций, числа колонок, шрифта и т.д.
КонтактыКонтактыИева Портная
руководитель отдела дигитализации Тел.: +371 22322733
Эл. почта: : [email protected]