Kompleksowe wdrożenia

Informacje ogólne

DInGOdLibra, dMuseion, dArceo oraz dLab tworzą komplementarny zestaw narzędzi, który wspiera instytucje kultury i nauki w kontekście realizacji zadań związanych z digitalizacją, udostępnianiem i przechowywaniem cyfrowych zasobów dziedzictwa kulturowego. W szczególności umożliwia rozpoznawanie tekstu (OCR), współprace z zewnętrznymi pracowniami digitalizacji, automatyczną konwersję danych źródłowych (plików master/plików wzorcowych) do wersji prezentacyjnej, długoterminowe przechowywanie danych źródłowych oraz budowanie bibliotek i muzeów cyfrowych. dLibra, dMuseion oraz dArceo realizują poszczególne funkcje całościowego procesu digitalizacji, dLab natomiast umożliwia ich współdziałanie, dając w rezultacie kompletny system dla masowej digitalizacji, przeznaczony dla instytucji nauki i dziedzictwa kulturowego.

Analiza przypadku – Repozytorium Cyfrowe Instytutów Naukowych

Repozytorium Cyfrowe Instytutów Naukowych (RCIN), jak napisano na dedykowanym portalu, ma na celu utworzenie „ogólnodostępnego, ponadregionalnego i multidyscypinarnego Repozytorium Cyfrowego złożonego ze zdigitalizowanych materiałów archiwalnych, publikacji naukowych, dokumentacji badań oraz piśmienniczego dziedzictwa kulturowego wyselekcjonowanych ze zbiorów 16 polskich instytutów naukowych oraz ich bibliotek tworzących Konsorcjum Repozytorium Cyfrowego Instytutów Naukowych”.

Współtworzące RCIN instytuty korzystają w trakcie prac digitalizacyjnych z kilku niezależnych pracowni digitalizacji, wykorzystują mechanizm list przewozowych w celu nadzorowania aktualnych lokalizacji oryginałów, oraz posiadają w swoich zbiorach specyficzne zasoby (np. tzw. klocki introligatorskie), wymagające dedykowanych rozwiązań w systemie zarządzającym procesem digitalizacji. Wszystkie te wymagania zostały uwzględnione przy kompleksowym wdrożeniu oprogramowania oferowanego przez PCSS. Jest to mianowicie system dLab zarządzający procesem digitalizacji, system dLibra udostępniający zasoby w Internecie w postaci prezentacyjnej oraz system dArceo w którym zarchiwizowane są dane źródłowe.

Ogólny schemat wdrożenia i współdziałania systemów dLab, dLibra oraz dArceo zaprezentowano na rysunku poniżej.

Współdziałanie systemów dLab, dLibra oraz dArceo.

Systemy dLab, dLibra oraz dArceo - zasada współdziałania.

Centralnym systemem zarządzającym całym procesem digitalizacji w RCIN jest dLab, który odpowiada za monitorowanie realizacji poszczególnych kroków digitalizacji. W ramach tych kroków znajdują się te w efekcie których następuje komunikacja z systemami dLibra oraz dArceo. W przypadku oprogramowania dArceo jest to archiwizacja powstałych w wyniku digitalizacji plików matek (plików wzorcowych), natomiast w przypadku systemu dLibra jest to upublicznienie obiektów cyfrowych (ich wersji prezentacyjnej) w Internecie. Integracja systemu dLab i dLibra ma jeszcze jeden dodatkowy wymiar. Mianowicie oba systemu zostały skonfigurowane we wdrożeniu RCIN w taki sposób, aby po utworzeniu publikacji planowanej w systemie dLibra automatycznie tworzyło się zadanie digitalizacji w systemie dLab. Dzięki takiemu podejściu możliwa jest wysoce wydajna automatyzacja prac związanych z digitalizacją i udostępnianiem zasobów w Internecie.

System dLab, poza krokami odpowiedzialnymi za komunikację z systemami dLibra oraz dArceo, współpracuje również w ramach RCIN z zewnętrznymi narzędziami, które służą do przygotowania wersji prezentacyjnej obiektu cyfrowego:

  • Document Express w celu przygotowania plików prezentacyjnych DjVu,
  • ABBYY Recognition Server w celu przygotowania plików prezentacyjnych PDF.

W obu przypadkach pliki prezentacyjne mogą być wzbogacone o warstwę tekstową, przygotowaną przez dedykowane silniki OCR.

Ponadto system dLab ma wbudowane dodatkowe mechanizmy i rozszerzenia, m.in. pozwalające na:

  • masową zmianę nazw plików wg określonego szablonu (np. tuż po skanowaniu),
  • wykonywanie kopii bezpieczeństwa przed finalnym archiwizowaniem obiektów w systemie dArceo,
  • wymuszanie określonego nazewnictwa zadań tworzonych w systemie dLab.

Dodatkowo w ramach systemu dLab istnieje szereg szczegółowych raportów nt. stanu prac digitalizacyjnych, np.:

  • raport z listą zadań nieukończonych od określonej wskazanej daty
  • raport z listą zadań co do których nie ma określonego stanu praw autorskich
  • raport z listą zadań w których autor nie zgodził się na publiczne udostępnienie dzieła

Podsumowując, na potrzeby RCIN system dLab został dostosowany do złożonego procesu digitalizacji, w ramach którego istnieje łącznie aż 29 typów czynności. W RCIN zostały wprowadzone dwie grupy zadań, których wykonywanie realizowane jest na poziomie tzw. klocka introligatorskiego oraz listy przewozowej. W ramach przepływu pracy 5 czynności realizowanych jest całkowicie przez automaty, natomiast 6 czynności wspomaganych jest przez dedykowane narzędzia automatyzujące pracę (np. zmiana nazw plików).

W celu uzyskania szczegółowych informacji na temat oprogramowania dLab, dArceo, dLibra lub dMuseion prosimy o bezpośredni kontakt.

Kompleksowy pakiet oprogramowania do gromadzenia, przechowywania i udostępniania obiektów cyfrowych