国立情報学研究所が各機関から提供された論文を業者に委託してPDFにし,公開する事業があった.この事業により多くの紙の論文が図書館にいかずとも無料,あるいは有料で見ることができるようになった.
しかし,この事業によって作られたPDFにはいくつかの大きな問題があり,元の紙の論文からPDFデータへ複製するときに情報の劣化が起きている.
1. 写真が見えない
古い論文の写真や図版は白黒ではあるが,濃淡によりきれいに対象が表現されていた.それが論文をスキャンするときに,単純な白黒設定でスキャンしたことで写真のグレーが黒に置換され,写真が見るに耐えないものになった.また顕微鏡写真では,淡い丸が一面に出ていることがある.
例
コアに見られる生痕化石の特徴 ― カナダ,下部白亜系ヴァイキング累層より―(フォト)
CiNii 論文 - 熊本県天草下島の西部に露出する上部白亜系姫浦層群の地質
2. OCR処理がうまくできていない
スキャンした後でOCR処理を行っているが,この処理がうまくできていないことが普通であり,コピーペーストや検索がうまくできない.
例
北米大 陸」ヒ西 部 に 分ネrJす る ト部白亜系 VlkLng累層は.主 に 泥岩 ・砂岩や礫岩などの 陸源性砕屑物か らな り,石油や ガス の 貯留岩 として 良 く知 られて い る.紹介す る コ ァ は外洋の 陸棚堆 積物で あり.砂 と泥の 細 lll層 で あ っ た地層が 生 物の 活動 に よ っ て 擾乱を 受 け.混合された もの で あ る.この よ うな外洋の 陸棚
コアに見られる生痕化石の特徴 ― カナダ,下部白亜系ヴァイキング累層より―(フォト)
3 図版が抜けている
これは電子化業者の問題であるとは限らない.例えば提供した論文にそもそも抜けていたりすることがあるからである.しかし,かつての習慣であった論文の一番最後に地質図などの大きめの図を載せる習慣を理解せずにスキャンしたのかもしれない.それは業者の無理解である.
例
一番大事な地質図 (地表面に出ている岩石や地質情報を記載した物) がない.
4 PDFファイルにロックがかけられている
これは日本の電子ジャーナル公開システムだけの最悪の特徴であるが,文字にハイライトや書き込みをすることもできない.ファイルによっては文章をコピーすることができなくなっている.
何をもってこの頭の悪い仕様にしたのか理解に苦しむが,とにかくここが大事だなとメモをすることもできないし,重要箇所に色でマーキングができない.そして場合によっては文献を検索しようとして引用文献をコピーしようとするとそれすらも妨害される.
まとめ
大きな問題点は少なくともこの4つだ.ほかにもCiNiiのpdfファイルが突然使えなくなる事件,J-STAGEが攻撃されてサイト全体が長期にわたって閲覧不能になる事件,J-STAGEが重すぎていらいらする件など文句を言いたいことはたくさんある.
スキャンファイルがゴミな件は業者がゴミ,それ許容する国がゴミ,チェックしない学会がゴミというトライアングル.
ゴミPDFは著作権を委託した著者への冒涜である.
今からでも何とかしてくれ.