36
Технологии и практика формирования электронных ресурсов для библиотек Андренюк Вадим Анатольевич Корпорация ЭЛАР

New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Технологии и практика формирования электронных ресурсов для библиотек

Андренюк Вадим АнатольевичКорпорация ЭЛАР

Page 2: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

2

Оцифровка для проекта НЭБ

Коллекции:• Детская дореволюционная периодика, книги, учебники• Списки чинов военных и гражданских• Епархиальные ведомости• Промышленность, кооперативы дореволюционной России• Сельское хозяйство и лесоводство регионов России • Столыпинская аграрная реформа• Тульское оружие: история, технология, мастера• Литература по этнографии больших и малых народов России

Участники проекта: РГБ, РНБ, ГПНТБ, РГДБ, региональные библиотеки

Page 3: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Президентская библиотекаФонды:• Русское географическое общество• Государственная публичная историческая библиотека• Фундаментальная библиотека РГПУ им. Герцена• Уральский федеральный университет• Региональные библиотеки• Библиотеки крупнейших музеев

Page 4: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Создание электронных фондов библиотек

Электронный фонд библиотеки создается:• Целевым порядком в рамках государственных, ведомственных,

региональных и других программ по оцифровке библиотечных фондов

• Целевым порядком в целях обеспечения сохранности единиц хранения, путем включения копии в страховой фонд

• Целевым порядком на наиболее часто запрашиваемые читателем издания

• В процессе выполнения заказов на копирование• В процессе других работ

4

Page 5: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Основные проблемыПроблема

Небольшие общие объемы оцифровки

Причина

Недостаточное финансирование

Незначительные объемы создания мастер–копий особо ценных, раритетных изданий, рукописей, книжных памятников

Высокая стоимость Необходимо специальное оборудование и

высококвалифицированные специалисты Требуется организация хранения образов большого

объема

Небольшие объемы оцифровки крупноформатных оригиналов

Высокая стоимость Необходимо специальное оборудование

Обеспечение долговременного хранения электронных ресурсов

Необходимо создание технической инфраструктуры хранения

Авторское право (ГК РФ часть 4)Невозможность оцифровки современной литературы

Page 6: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

№1 постановка задачи

Page 7: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

определение главной цели оцифровки

Создание электронного каталога

Обеспечение сохранности ценных и ветхих оригиналов

Создание электронного страхового фонда

Обеспечение многопользовательского доступа к редким,

историческим и научным материалам

Создание общедоступных онлайн-ресурсов и виртуальных

коллекций и т.д.

Page 8: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

сбор требований

Выделить наиболее востребованную часть фонда и разбить работы на этапы –основные и вспомогательные

Исключить избыточность работ

Определить требования к качеству выходного ресурса

Определение реальных сроков работ

Определение окончательного состава работ и инфраструктуры

Оптимизация затрат за счет сканирования в достаточном для выполнения задачи качестве

Действие

Результат

Page 9: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Отсутствие единых стандартов оцифровки

Президентская библиотека имени Б.Н.Ельцина

• Сканирование без потери качества

Центральная научная медицинская библиотека

• Сканирование в JPG (сжатие)

Региональные библиотеки

• Сканирование собственными силами библиотек

Поэтому были разработаны методические рекомендации и технические требования при переводе в цифровую форму библиотечных материалов

Высокие требования

Стандартные требования

Различные требования

Page 10: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Выработка единых стандартов и требований Для исключения ошибок и расхождений в итоговом качестве электронного ресурса

Существуют Методические рекомендации по оцифровке библиотечных фондов

http://www.nlr.ru/pro/inv/digit_copy

Page 11: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

№2 методические рекомендации

Page 12: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Разделение фондов на три категорииI категория «Раритеты»книжные памятники, особо ценные и редкие книги

II категория «Художественно-культурные ценности, и социально значимые издания»издания, представляющие особую художественную и культурную ценность

III категория «Информационно-значимые издания»тиражная литература, представляющая ценность только как информация

Page 13: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Формирование требований к оцифровкеМастер-копия не ниже 600 dpiсодержит максимально возможное количество информации и предназначена для воссоздания максимально точной бумажной копии документа и как основа для изготовления других цифровых копий

Пользовательская копия не ниже 300 dpiоптимизирована для максимально удобного просмотра на локальном компьютере пользователями в библиотеках

Просмотровая копия не ниже 150 dpiсоздается для просмотра в Интернет, имеет возможность полнотекстового поиска

Page 14: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

I категория «Раритеты»

• Мастер-копия сканирование обложки

и всех страниц TIFF, сжатие без потери качества

(LZW)

сертифицированная цветовая мишень

RGB Color 24 Bit не ниже 600 dpi

Пользовательская копия JPEG, сохранение 80% качества

RGB Color 24 Bit

не ниже 300 dpi

единый размер образов

Служебная копия PDF, максимально допустимое

сжатие 50%

автоматическое распознавание без верификации

RGB Color 24 Bit

не ниже 150 dpi

книжные памятники (до 1830 г.), особо ценные и редкие книги, рукописи.

Page 15: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

II категория «Художественно-культурные ценности»

• Мастер-копия сканирование обложки и всех

страниц TIFF, сжатие без потери качества

(LZW)

сертифицированная цветовая мишень

RGB Color 24 Bit не ниже 300 dpi

Пользовательская копия JPEG, сохранение 80% качества

RGB Color 24 Bit

не ниже 300 dpi

единый размер образов

Служебная копия PDF, максимально допустимое

сжатие 50%

автоматическое распознавание без верификации

RGB Color 24 Bit

не ниже 150 dpi

издания, представляющие особую художественную и культурную ценность, содержащие авторские иллюстрации и рисунки

Page 16: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

III категория «Информационно-значимые издания»

• Мастер-копия не требуется

Пользовательская копия JPEG, сохранение 80% качества

Greyscale 8 Bit, не ниже 300 dpi для текста

RGB Color 24 Bit, не ниже 300 dpi для иллюстраций

единый размер образов

Служебная копия PDF, максимально допустимое сжатие

50%

автоматическое распознавание без верификации

Greyscale 8 Bit, не ниже 150 dpi для текста

RGB Color 24 Bit, не ниже 150 dpi для иллюстраций

тиражная литература, которая представляет ценность только как информация, а не как печатные издания

Page 17: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

№3 реализация проекта по оцифровке

Page 18: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

комплексный подходСоздание электронных информационных ресурсов «под ключ»

Подготовка фондов Бережная оцифровка Индексирование

Создание PDF книгРаспознавание

Электронный каталог

Загрузка

Page 19: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Подготовка фондовПрофессиональная экспертиза, выделение востребованной части фондов, подготовка к сканированию

Реставрация фондов: при необходимости после или до процесса оцифровки

Page 20: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Выбирать сканеры необходимо исходя из задач

Роботизированные комплексы оцифровка книг в автоматическом режиме

Планетарные сканеры бесконтактная оцифровка сброшюрованных документов

Комплексы высококачественного сканирования бесконтактная оцифровка крупноформатных документов

Документные сканеры скоростная оцифровка каталога и картотек

Сканеры микроформ оцифровка пленочных носителей информации

Page 21: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Рекомендации к составу оборудования

• комплексы высококачественного сканирования применяются для I и II категорий фондов, использование прижимного стекла не допускается

• специализированные книжные сканеры с использованием специальных колыбелей во избежание изгиба переплета применяются для II и III категорий фондов, допускается использование прижимного стекла в случае удовлетворительного состояния издания. Если угол раскрытия книги ограничен, ее сканирование производится только с применением специальной колыбели, обеспечивающей угол раскрытия изданий до 120°)

Оборудование должно обеспечивать читаемость с пространственной частотой линий 5,6 тест-объекта разрешения (ГОСТ 13.1.701-95)

Page 22: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Рекомендации к составу оборудования

• специализированные поточные сканеры в особых случаях по решению владельца фонда допускается для IIIкатегории фондов. Категорически не допускается для фондов I и II категорий

• планшетные документные сканеры в особых случаях по решению владельца фонда допускается для IIIкатегории фондов. Категорически не допускается для фондов I и II категорий.

• специализированные сканеры микроформи сканеры слайдов с высоким разрешением применяются для материалов на фишах и пленках

Оборудование должно обеспечивать читаемость с пространственной частотой линий 5,6 тест-объекта разрешения (ГОСТ 13.1.701-95)

Page 23: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Выбор сканера «только по разрешению» - риск создания неполноценных цифровых коллекций

• Высокое разрешение сканеров –видимая гарантия высокого качества • Способ обеспечения такого разрешения у ряда сканеров – использование технологииинтерполяции (фильтр Байера)• Удобство работы с оригиналами, возможности ПО сканирования – существенное влияние

напроизводительность и технологию оцифровки• Результат применения таких сканеров – от низкого качества цифровых копий до

невозможности проводить оцифровку• Книжный сканер должен оцениваться как программно-аппаратный комплекс, а не просто оптическо-цифровое устройство

Page 24: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

ИндексированиеРетроконверсия – ручной человеческий труд по извлечению атрибутивной информации и контролю процессов индексирования

• Специально обученные сотрудники

• Обработка символов любой сложности: рукописные, на

иностранных языках, диакритические знаки

Page 25: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Почему ретроконверсия?

Библиотечная карточка – сложнейший документ для извлечения данных

Несмотря на технический прогресс многие документы распознать автоматически невозможно

Page 26: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Качество электронных изображений

Полное соответствие электронной книги – бумажному оригиналу

Графические изображения высокого качества

равномерное освещение, без бликов и теней

отсутствие геометрических искажений

соответствие цветовых оттенков

читаемость всех деталей, включая самые мелкие, а также карандашные наброски и затухающий текст

Page 27: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Обработка изображений• Цифровая копия должна сохранить соответствие оригиналу• Не допускаются потери информации или наличие артефактов• Не производится изменение цветового режима• Развороты с логически связанной информацией должны

быть в виде единого изображения• Единый размер графических образов страниц в рамках одного издания• Образы неформатных страниц издания должны сохранять оригинальный размер

и пропорции• Выравнивание изображений по верхнему краю• Выравнивание строк без потерь информации

Page 28: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Улучшение качества изображений Геометрическая коррекция 1D и 2D коррекция освещения Маскирование отпечатков пальцев Интеллектуальная бинаризация Исправление цветовых и тоновых дефектов и другие

Page 29: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Создание PDF книг

Проверка отсканированного ресурса

Дополнительная обработка копий (обрезка полей, удаление мусора, склейка образов)

Классификация PDF книг

Сборка PDF книг (распознавание текста, гиперссылки, проверка целостности, формирование структуры)

Page 30: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Загрузка

Конвертация данных в необходимый формат: RUSMARC, UNIMARC, MARC-21 и др.

Page 31: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

№4 возможные сложности

Page 32: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Сложности подготовкиОбъемыдиктуют сложности обработки (тысячи книг, сотни тысяч документов)

Разнотипные документы (cшитые, расшитые, крупноформатные, ветхие)

требуют разнообразного оборудования для сканирования и реставрации

Сжатые срокиуменьшают качество проработки проекта и могут увеличивать стоимость работ

Page 33: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Сложности реализацииПодготовка проекта обучение специалистов, необходимость профессионального оборудования, организация безопасности работ, обеспечение сохранности первоисточников

Оцифровкаразличное качество и состояние документов

Индексированиесложные символы, наличие подготовленных операторов, контроль качества, формирование БД в нужном формате и обеспечение импорта данных

Page 34: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

• магнитные жесткие диски (HDD)• оптические DVD компакт-диски• RAID-массивы

Хранение информации

Развитие поисковых сервисов в больших объемах информации

Page 35: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Более 2 000 реализованных проектов в сфере культуры

Если вам понадобится наш совет, опыт и компетенции вы всегда можете обратиться в корпорацию ЭЛАР

на рынке оцифровки25 лет

производит собственное сканирующее оборудование15 лет

более2 000

Корпорация ЭЛАР Тел.: +7 (495) 274-31-31

email: [email protected]сайты: www.elar.ru, www.planscan.ru

Page 36: New Технологии и практика формирования ...chelreglib.ru/media/files/prof/shkola_nabb_2017/andren... · 2017. 10. 19. · Технологии и практика

Что выбрать?

Самостоятельные работы Профессиональная компания

самостоятельное проведение подготовительных работ

подготовка помещения

приобретение и последующая поддержка оборудования и ПО

наем и обучение персонала/выделение кадровых ресурсов

разработка и внедрение технологии

наличие дополнительных услуг экспертизы и реставрации

возможность работы на территории заказчика

парк профессионального оборудования и ПО

наличие квалифицированных кадров

отработанные годами технологии