Sejarah Dan Perkembangan OAI-PMH

Bahasan pada bab ini meliputi :

  • Akar OAI-PMH
  • Pertemuan Santa Fe
  • Tantangan Dan Solusi Yang Diusulkan
  • Muculnya Protokol OAI
  • Sejarah Versi OAI
  • Penyebaran Yang Fleksibel
  • Ringkasan
  • Tujuh Definisi Kunci
  • Sumber Informasi Lanjut

3.1 Akar OAI-PMH

Akar OAI-PMH bermula dari pengembangan repositori e-print (karena itulah disebut arsip). Repositori e-print didirikan dengan tujuan mengkomunikasikan hasil penelitian ilmiah sebelum direview dan publikasikan. Repositori e-print yang pertama adalah xxx kemudian berubah menjadi arXiv yang memuat hasil penelitian  fisika energi tinggi pada tahun1991 kemudian dalam perkembangannya ditambah bidang matematika, ilmu-ilmu non-linear dan ilmu komputer. Selain itu ada CogPrints yang memuat bidang psikologi, linguistik dan neuroscience. Jaringan perpustakaan ilmu komputer atau Networked Computer Science Technical Reference Library (NCSTRL) menyediakan akses ke laporan ilmiah di bidang ilmu komputer yang disimpan di xxx atau repositori dari departemen-departemen yang bekerja sama dalam penelitian. Ada juga RePec yang menyediakan tempat untuk menampung paper di bidang Ekonomi atau EconWPA di Washington University. Sebagai tambahan Networked Digital Library of Theses and Dissertations (NDLTD) juga membangun sebuah perpustakaan digital yang berisi thesis dan disertasi yang ditulis oleh para mahasiswa.

Mekanisme pengisian repositori ini pada keseluruhan kasus diisi sendiri oleh si penulis. (Pada OAI yang disebut e-print adalah penulis yang mengarsipkan dokumennya). Tdengan memanfaatkan web, orang-orang bisa berinteraksi dengan repositori ini dan mendapatkan bantuan yang disediakan. Tiap repositori memiliki interface web yang berbeda-beda sesuai tujuan mereka, sehingga pengguna akhir mau tidak mau harus mengenal bermacam-macam interface tersebut untuk mendapatkan bantuan dari repositori yang berbeda-beda. Contoh satu kasus, RePec menggunakan protokol Guildford  sedangkan NCSTRL menggunakan protokol Dienst. Kedua protokol ini memberikan banyak layanan pada pengguna akhir termasuk pencarian lintas repositori pada masing-masin grup. NDLTD membuat alur kerja untuk pengiriman materi dan mengembangkan XML DTD (Document Type Description) untuk ETD (electronic thesis and disertation) pada perpustakaan digital mereka. Bagaimanapun, dari protokol-protokol ini hanya sedikit atau bahkan tidak ada yang mendukung sharing metadata antar lingkungan yang berbeda, dan belum ada inisiatif untuk membuat komunikasi ilmiah. Para tokoh kunci dalam hal ini melihat adanya interoperabilitas antar repositori menjadi sangat penting untuk ditangani komunitas e-print.

3.2 Pertemuan Santa Fe

.. dampak bersama dan masa depan inisiatif ini secara substansial akan lebih tinggi  jika interoperabilitas antara mereka [arsip e-print] dapat dibentuk  ..
(Ginsparg, Luce, Van de Sompel, UPS Call, July 1999)

Dua masalah utama dalam hal interoperabilitas yang bias merusak arsip e-print adalah :

  1. Pengguna dihadapkan pada berbagai interface yang berbeda sehingga menyulitkan penelusuran
  2. Tidak adanya solusi berbasis mesin (bukan dilakukan manual oleh manusia) dalam hal sharing metadata.

Solusi yang sedang dikembangkan, mencakup pencarian lintas arsip (di satu sisi) dan pengambilan metada (di sisi lain) dengan tujuan menyediakan layanan pencarian terpusat. Pada bulan Juli 1999 Paul Ginsparg, Rick Luce, dan Herbert Van de Sompel dari Los Alamos National Laboratory mengundang beberapa ahli teknis untuk menghadiri pertemuan Santa Fe di New Mexico pada bulan Oktober tahun yang sama. Saat itu Ginsparg merupakan anggota arXiv, sedangkan Van de Sompel memiliki koneksi dengan Universitas Ghent. Mereka mengusulkan pembentukan sebuah layanan universal bagi penulis untuk mengarsipkan sendiri literatur ilmiah (Universal Preprint Service, or UPS). UPS akan menjadi landasan untuk informasi ilmiah serta bersifat gratis sehingga hal ini akan menumbuh-suburkan service atau layanan lain baik yang bersifat gratis maupun komersil. Langkah pertama yang dikerjakan adalah membuat sebuah teknologi interoperabilitas dan kerangka kerja untuk penyebaran e-print. Hal ini telah diumumkan kepada khalayak umum dengan judul “Open Archieve Initiative bertujuan memberikan solusi bagi para penulis untuk mengarsipkan dokumen secara mandiri”.

Tujuan dari pertemuan Santa Fe adalah untuk mendiskusikan masalah interoperabilitas, kesepakatan untuk mewujudkan prototipe layanan perpustakaan digital berdasarkan repositori e-print yang ada, dan mendirikan sebuah forum yang secara kontinu membahas masalah interoperabilitas terkait solusi pengarsipan secara mandiri. Sebagai persiapan pertemuan tersebut, beberapa pekerjaan mendasar dilakukan. Van de Sompel memulia sebuah projek yang mensimulasikan beberapa aspek interoperabilitas distribusi arsip e-print. Thomas Krichel (University of Surrey & RePEc) melakukan percobaan dengan mengkonversi data dari inisiatif e-print yang ada ke format metadata ReDif yang digunakan di RePec. Michael Nelson (NASA Langley) mengambil beberapa data dan menggunakannya untuk menciptakan berbagai arsitektur arsip sebanyak konsep Smart Object Dumb Archives miliknya. Data yang digunakan berasal dari beberapa sumber termasuk CogPrints, NASA, NCSTRL, RePEc dan xxx. Tujuan dari pekerjaan ini bukan untuk membuat rumusan arsitektur UPS, tetapi lebih untuk memfasilitasi diskusi mengenai UPS pada pertemuan bulan Oktober nantinya.

3.3 Tantangan Dan Solusi Yang Diusulkan

Pencarian silang atau harvest (mengambil metadata)

Penentuan arah pengembangan rancangan framework UPS merupakan isu utama dalam perptemuan pertama ini. Dua pendekatan yang dimungkinkan adalah pencarian lintas arsip yang didasarkan pada protokol seperti Z39.50, atau cara lain adalah mengumpulkan metadata dari berbagai repositori e-print ke dalam satu atau lebih pusat layanan sehingga lebih memudahkan pengguna.

Berdasar pengalaman perpustakaan digital selama ini, pencarian lintas repositori atau pencarian silang memiliki kinerja yang buruk. Sebagai contoh yang terjadi pada NCSTRL, ketika data didistribusikan pada sekelompok kecil node, pencarian masih berjalan normal. Tetapi ketika node mencapai 100 atau lebih, pencarian menjadi sangat lambat. Begitu pula yang terjadi di Resource Discovery Network (RDN) United Kingdom. Bahkan pencarian silang yang hanya melibatkan 5 gateway saja, sudah amat buruk kinerjanya.

Advertisement