持続可能なデジタルアーカイブ:キーワード検索とIIIF提供における外部連携の活用

2024−11−30

江草 由佳(国立教育政策研究所)

ここでは持続可能なデジタルアーカイブの公開を目指して静的なファイルだけでデジタルアーカイブを提供する方法について簡単に紹介する。静的ファイルとして作成することにした理由や工夫した点、どのようなツールを使ったかなど、以前にまとめたものがあるので詳細についてはそちらも参照して欲しい1。ここでは、特に、当該文献に書いていない点を中心に紹介したい。また、ここで紹介する内容の一部については、「産業のシーズを見つけよう!DAショートトーク!」第19回で発表した内容2と重複する部分があるのでこちらも参考にしてほしい。

私は国立教育政策研究所教育図書館(以降、教育図書館と呼ぶ)が提供するデジタルアーカイブの開発に長く関わってきた。2018年8月30日に公開した「国立教育政策研究所教育図書館貴重資料デジタルコレクション」(以降、貴重資料デジタルコレクションと呼ぶ)についても、開発の最初から関わった。

国立教育政策研究所教育図書館貴重資料デジタルコレクション
https://www.nier.go.jp/library/rarebooks/

貴重資料デジタルコレクションの対象資料は100点程度と比較的小規模であり、かつ、デジタルアーカイブ構築後に修正や新規資料の追加はほぼないであろうと見込まれる状況であった。このデジタルアーカイブの開発を進める前に、「ウェブを通してどこからでも、誰でも利用できること、ずっと公開し続けられること」を最優先事項として設定した。開発を進めるにあたって、機能やツールなどなにかしら選択しなければならない状況が出てきた場合は、常にこの優先事項を振り返って、この優先事項に合致するかどうかで判断していった。

「ずっと公開し続ける」ためには、「維持・移行」のコストを最小限に抑えることが最重要と考えた。そのため、静的ファイル(HTML、CSS、JavaScript、JPEG、PDF、PNG)だけで「貴重資料デジタルコレクション」を構築した。つまり,ウェブサーバーさえあれば,フォルダごとこれらのファイルをコピーするだけでシステム移行が実現するようにした。

静的ファイルだけで実現できることだけで、できるだけ利便性を損なわないように、様々な工夫を行った。例えば、JavaScriptで動く画像ビューアを採用して、ブラウザ上でプレビューや拡大等ができるようにしたり、資料の印刷を簡便にするために資料全体を1つのPDFファイルにしたものをダウンロードできるようにしたりなどである。

貴重資料デジタルコレクションでは、キーワード検索を提供していない。貴重資料デジタルコレクションで提供している検索は、いわゆるカテゴリ検索で、カテゴリをたどっていけば求める資料にたどり着くようにしたものだけである。カテゴリには例えば、掛図、教育用絵画、教育双六などがある。300点程度(公開当初は大きく増えない見込みだったがカラー撮影画像の増加にともない対象が拡大したため100点程度から増加した)しかないので、この検索だけでも最低限の検索の提供となっていると考えるが、やはり、キーワード検索したくなる場面は出てくる。教育図書館の職員でもたまにキーワード検索がしたいなというシーンがあるとのことであった。

これについては、外部のウェブサービス(国立国会図書館サーチおよびジャパンサーチ)と連携することで、実現できた。貴重資料デジタルコレクションは、国立国会図書館サーチおよびジャパンサーチの連携について、2019年6月28日の国立国会図書館サーチ担当者からのメールを皮切りに検討を始め、2021年3月29日には国立国会図書館サーチとの連携が、2021年5月14日にはジャパンサーチとの連携が実現した。ジャパンサーチと連携すると、デジタルアーカイブごとの画面が用意され、そこにキーワード検索のための検索窓もあるため貴重資料デジタルコレクションに対してキーワード検索を行うことができるようになった。

ジャパンサーチにおける貴重資料デジタルコレクションのページ(赤四角部分がキーワード検索窓)
https://jpsearch.go.jp/database/nier_rare

国立国会図書館サーチでもデータベースを指定することで同様に貴重資料デジタルコレクションに絞ってキーワード検索が行える。

国立国会図書館サーチで貴重資料デジタルコレクションを指定したところ(赤四角部分)

貴重資料デジタルコレクションでは、IIIFでの提供を行っていない。これについては、ジャパンサーチの簡易IIIF-API3によって実現できた。2022年10月21日に私がジャパンサーチの簡易IIIF-APIについての問い合わせメールをジャパンサーチに送ったことを皮切りに、準備が進み2023年2月2日にジャパンサーチ上での貴重資料デジタルコレクションのIIIFでの提供が開始した。この簡易IIIF-APIを実現するためには、本文画像をJPEGで公開すること(PDFではできない)、本文画像のURLもしくは本文画像のURLの生成ルールを提供できることが条件となる。この簡易IIIF-APIの利用は貴重資料デジタルコレクションが初の提供事例であったようで、教育図書館から国立国会図書館サーチへ本文URLリストを渡すための国立国会図書館サーチ側のシステム改修もこれを機に行われたようである。

ジャパンサーチでIIIFを通した提供(赤四角部分)
https://jpsearch.go.jp/item/nier_rare-R100000106_I000000069_00

教育図書館はまだまだデジタル化していない資料(教科書など)がたくさんある。そのため、一つでも多くの資料をデジタル化し、「ウェブを通してどこからでも、誰でも利用できること、ずっと公開し続けられる」デジタルアーカイブのデジタル資料を増やすことが最も重要だと考える。

デジタルアーカイブ提供機関は資料を一つでも多くデジタルアーカイブに載せるところを頑張り、キーワード検索やIIIFといった機能の提供はジャパンサーチのような連携先の外部サービスに任せるといった分担ができるといいのではないだろうか。

  1. 「移行しやすく使いやすいデジタルアーカイブの構築:教育図書館貴重資料デジタルコレクションの経験から」江草由佳, 情報知識学会誌, 2019年28巻5号 p. 367-370
    https://doi.org/10.2964/jsik_2019_016 ↩︎
  2. 「小規模図書館における持続可能なデジタルアーカイブ:スリムモデルと外部連携」江草由佳, 「産業のシーズを見つけよう!DAショートトーク!」第19回, 2023年11月24日
    https://youtu.be/DDFs9UHyoXc
    https://drive.google.com/file/d/1R7Ti5feuosFvHJj0UGREv_wpqMHJwKMD/view?usp=drive_link
    (参照日:2024-10-20) ↩︎
  3. 「簡易IIIF-API」,「ジャパンサーチのメタデータ連携について」, p.5, 2020年
    https://jpsearch.go.jp/static/pdf/cooperation/jps_manual_202010.pdf
    (参照日:2024-10-20) ↩︎