[作成:吉田惠吉(「高屋敷の十字路」管理人)]


目      次
00.はじめに
01.情報検索と情報源
02.情報検索の手順と検索システムの機能および機器
03.図書や雑誌の所蔵や書誌情報そのほかを調べる
04.Web版(CD-ROMの利用も含む)検索情報源のいろいろ
05.オンライン(あるいはWWW)でデータベースを調べる
06.Webページ情報を調べる
07.電子ジャーナルや分野別情報が入手できるサイトを調べる

00.はじめに

 授業前のウオーミングアップみたいな富短の図書館でのひととき、たまたまブラウジングしていた新着書図書館関連雑誌で利用者と図書館サービスの動向をパターン化した短い記事を見かけた。記憶にとどめたつもりでメモも、コピーも残さなかったのがいけなかった。
 後になってオンライン雑誌記事索引でどれだけ調べてもこれという書誌が見つからず、珍しい姓だった著者名を頼りに関連記事の参考文献リストなどを眺めても出てこず、たぶん掲載雑誌だったと思う『図書館雑誌』のバックナンバーにあたりをつけ、数年分を遡ったらあった。
 呑海沙織「利用者指向の図書館サービス―変化する利用者と図書館の関係性―」;図書館雑誌 99(11)2005 p.784-785、がその書誌データ。[「BIBLIS for Web ver 2.0〜図書館情報学文献目録データベース〜」でヒットします]
 たった2ページだったから、雑誌記事索引データベースの採録対象から外れたということだったんだけど、うかつにも雑誌記事や論文が2次情報化されるかされないかの基準頁数を失念していた。
 貸し出し期限切れの図書を督促したら「借りた憶えがない」と言われ、当該貸出記録データで確認を求めたら、「自分じゃない」など、貸出した事実を情報化したデータを「ねつ造」などと退けられたりする貸出・返却サービス現場はさておき、求めていた〈情報〉が〈情報化〉されていなかったということから、「情報についての情報」がどのようなものかが見えてくる。
 富短の図書館の「概要」を毎年見ていると、司書課程のある経営情報学科の学生の利用率が他の学科にくらべて高くもなく、経年変化も少ないようだ。学生の図書館利用を云々するまえに、何はともあれとりあえず個人的に情報が収集できてしまいそうなインターネット情報環境を生きている実態がある。ネットで見つからなかったらあたかも存在しないかのような。
 日常的にコピー資料をどこにしまったかわからなくなったり、参考データをダウンロードしたことそのもを忘れたりしないよう、アーカイブしたものを探しだす技術的な解決策は簡便化の一途をたどる反面、自分が知っていることと知らないこととの界面がますます不透明になってきている。
 自分が何を知らないかによって知っていることの価値判断ができ、それによって自分が知らない情報を予知しようとする、メタ情報力とでもいうべき能力を失わないようにするにはどうすべきか。
 「私が知ってること」を少なく見積もる足と、「私が知らないこと」を多く見積もることのできるもう一方の足で立って、知的な歩みが続けられるよう、それぞれが「学力」を磨ける基礎体力を維持するしかない。情報機器を自転車のように使いこなせるにこしたことはないが、身体的な情報リテラシーの本筋は見失いたくない。
 インドの図書館学者・ランガナタンが提唱した「図書館学の五法則」(「WEBでも活きる『ランガナタンの五法則』」Webutubutu!-Older)の2番目は「人」が、そして3番目は「図書」が主体になっていましたね。そんな両者の出合いを関係づけているのが1番目の法則でしょう。
 現物やコピーによるやりとりから、ハイパーテキスト化された電子情報網によるやりとりまで、「人」と「図書」とのアクセス・ポイントのハイブリッド化を見通し、「すべての人」から「すべての図書」への情報のハブとなり、「すべての図書」から「すべての人」に向けてのアクセス・パスが開かれるネットワークには4番目と5番目の法則が編み込まれるでしょう。
 3.11以降、被災した図書館の復興が試みられています。瓦礫のなかの創設準備室から立ち上がってくる情報サービスのこれからについても考えましょう。

目次に戻る

01.情報検索と情報源

 情報検索とはどういうものか、前期の「情報サービス論」で学びましたが、あらかじめ蓄積されている情報の中から、利用者が必要な情報を探しだす「文献の検索法」(『資料検索法テキスト』第5章 2001年2月28日現在 2002年10月03日追加 文責 : 高山正也、岸田和明 )などを参考にして、誰でも利用可能な情報源の検索を試しながら、自発的に必要な情報を入手できる場としての図書館の役割を考え、その使い方を学ぶのが演習の狙いです。
 収集された情報の利用を想定した加工や、索引ファイルの作成など、必要な処理を経て物理的に蓄積されたさまざまな情報源が維持され、それらの中から必要な情報を探しだすという、情報検索の両側面の違いは何だったでしょう?
 図書館の所蔵目録情報は、カタロガーによってコレクションとしての1次情報が2次情報化され、蓄積された書誌所蔵データベースにアクセス可能なOPAC (Online Public Access Catalog)を検索し、得られた2次情報を介して所蔵する1次情報にたどりつけるように、情報次数の高次化および低次化の作用ベクトルを統合するものとして運用されている。
 かっては“マニュアル検索”といって紙媒体の2次情報を調べるしかなかったが、そのうち“機械検索”と呼ばれたりした高価で扱いにくいオンライン2次情報データベース検索システムの登場を経て、検索担当図書館員やサーチャー(「サーチャーの会」、「Searcher's Room(サーチャーの部屋)」)といった検索の専門家によるオンライン代行検索から、LANやインターネットを経由した末端情報消費者(エンドユーザー)主導のオンライン検索へと、図書館の情報検索現場も様変わりしたようだ。
 昨今の大学図書館のサービス現場では、WWW(World Wide Webあるいは単にWebとも言う)やCD-ROMベースの検索システムを使って、例えば「インターネットを利用して文献探索:日本語教育関係編」(ENJU@管理人)のように、調べたい事柄をかかえている利用者(エンドユーザ)が自分で検索するというようになってきている。
 情報検索と図書館のかかわりについては、上田修一氏(慶應義塾大学文学部教授)基調講演「日本の情報検索の歴史」(「びぶろす-Biblos」平成17年7月号(電子化29号)「平成17年度関東地区公共図書館協議会総会・研究発表大会報告」所収)でも触れられているように、図書館が提供しうる専門的な情報サービスを行うにあたって、より使いやすい導入のかたちが求められている。
 今じゃ図書館の外でも、インターネットに代表される情報技術の進歩と普及によって学術的・専門的な情報が、手軽に入手可能になってきているから、どのような検索手段を使えば何が調べられるか、実社会に出てからも役立つよう腕を磨いておいて損はない。
 だが、高次情報化された情報源の俯瞰と適切な選択によって、検索テーマの情報次数を低次化へとナビゲートできる情報検索環境となると、まだまだ新たな図書館の情報サービスの出番がありはしないか。
 情報検索(information retrieval/1950年代、Calvin N. Moorsによる造語とされる)は、検索対象となる情報内容(コンテンツ)の違いから、“文献検索(document retrieval)”に対して“ファクト(事実)検索(fact retrieval)”というように、“検索対象”の違いで区別することもできるが、いずれも調べる相手は“組織化して大量に蓄積されている情報の集合”であるデータベース(「データベースとは」BitArts)ということになる。
 検索テーマについて調べるのにふさわしいデータベースについてどのようなものがあるか、たとえば「データベース産業の現状と課題」(データベース振興センタ)みたいに数あるデータベースの情報内容(コンテンツ)を見極めるセンスを養わないといけないが、検索演習に使うデータベースが、以下の表のどのあたりに位置する情報源になるか、利用のたびに当てはめてみるようににしよう。

表01-1 データベース(コンテンツ)次数\表現媒体    
次数 \ 表現媒体 文字データベース 数値データベース 画像データベース 音声データベース 映像データベース マルチメディア・データベース
1次 (文献の)全文データ 統計データ、物性データ 静止画データ 音楽データ 動画データ 統合データ
2次(識別子) 書誌データ          
2次(意味子、参照子) 抄録・索引データ         
3〜高次 参照データ          

 よく利用されている、データベースへのアクセス方法としては、
(1)スタンドアローンで、あるいはCDチェンジャやネットワークを介した、CD-ROM(オンディスク)検索。
(2)古くから行われてきたが、今やインターネットに取って代わられつつある、電話などの通信回線を介してホストコンピュータに接続する、オンライン検索。
(3)インターネット経由で、データベース・サーバにアクセスする、インターネット検索。
の3種類が代表的だが、データベース・サービスの提供形態としては、現在(3)が最もよく利用されている。
 ほとんどの場合、個人の利用者が、プロデューサからデータベースを購入してデータベース・サービスを提供するディストリビュータ(distributor、あるいはvendorともいう)と契約可能だが、一般的に「商用データベース」(WING HEAD Inc.)は高額なので、大学図書館や専門図書館などが契約して、組織内の利用者に限定して提供する形がとられている。(「商用データベースをご利用ください」大阪市立図書館)
 図書館においても情報の検索は用語の問題から離れられず、とくに医学や薬学分野の情報検索において検索用語の取り扱いが検討されてきていて、たとえば医学情報検索の現場における「医学用語を歩く!」(シソーラス研究会)を一つの例として、情報検索の動向や検索システムで使われる用語からも目が離せない。

目次に戻る

02.情報検索の手順と検索システムの機能および機器

 情報検索の手順は、
(1)何を求めているのかをはっきりさせ、検索内容を明確にする。(検索テーマに関する3次情報を調べ、関連キーワードや事項を確認)
(2)どの検索システム、データベースを使うか、検索手段を選択する。
(3)たとえば「非統制語2次情報データベース」(主題索引語として件名を使用しないデータベース)では、検索者が検索テーマの同義語、関連語、下位語、場合によっては上位語を探して検索式化するなど、選択した検索システムやデータベースに見合った検索語(キーワード)を決め、検索式を作る。
(4)作成した検索式[「ブール演算と各種の検索式」(SEO検索エンジン最適化)]を実際に入力して、検索を実行する。
(5)得られた検索結果に、どのくらい必要としていた情報が含まれてい(なかっ)たかを評価する。
というような流れで行われるのが一般的。
 情報検索は、言語に依存した処理を多く含んでいるから、検索性能(search effectiveness,検索有効性ともいう)は、検索された文書の中で検索要求に適合する文書数の割合を精度(precision)、データベース中のすべての検索要求に適合する文書の中で検索 された文書数の割合を再現率(recall) 、という二つの尺度(ratio)を用いて評価され、この「再現率と精度」(LostMemories)で情報検索の効率を測る試みがあることも覚えておこう。
 ついでに、データベース中の全検索要求に適合する文書数が必要なため、再現率は実験的環境でしか 算出できないから、そのまま実際の検索業務の評価に役立てるには無理があるということも。
 一般的な手順に加え、利用する情報検索システムの機能がどのようになっているか、たとえば「NDL-OPAC(国立国会図書館蔵書検索・申込システム) 」や「GeNii(NII学術コンテンツ・ポータル)」を例に、たとえば以下のA、B、Cそれぞれの項目について具体的に確かめてみよう。
A.収録年や収録対象別に複数のデータベース(ファイル)を扱う際の、選択や切り替えをどうするか。
(1)検索データベースを最初に選択する。
(2)検索の途中で別のデータベースに切り替え、検索式を再利用する。
(3)複数のデータベースをまとめて同時に、マルチファイル検索、クロスファイル検索、横断検索などができ、検索結果から重複レコードが排除できる。
B.検索式の扱い方はどのようになっているか。
(1)それぞれの検索語について、入力するフィールド窓と検索対象フィールドの指定はどうなっているか。
(2)複数の検索語を組み合わせて検索する、「論理演算」(CyberLibrarian)をどのように検索条件として指定できるか。
(3)検索語の、語順や相互の離れ具合なども指定できる、近接演算が使えるか。
(4)2000年以降に出版された文献を探すのに、たとえば“出版年>1999”と範囲指定するような、数値の大小を比較する比較演算ができるか。
(5)前方一致(right truncationまたはsuffix)、後方一致 (left truncationまたはprefix)、中間一致(left-right truncation)、両端一致(中間任意[infix truncation])などの部分一致検索(トランケーション[truncation]) に対応しているか。
(6)検索語がデータと正確に一致しなくても、該当すると思われるレコードを自動的に検索する、あいまい検索や類義語検索に対応しているか。
(7)ある検索式で得られたレコードの集合、すなわち検索集合に対し、二次検索(制限検索)でさらに絞り込むことができるか。
(8)検索式を入力していくつかの検索の実行中に、すでに得られた検索集合を再び参照したり、実行済みの検索式を再指定できる、検索集合の保存や指定の仕組みがあるか。
(9)データベース中のレコードに含まれている、検索対象語(索引語)を参照したり、一覧表示させたり(expand機能)でき、表示させたものを選択して、そのまま検索式を実行できるか。
(10)これまでに入力した検索式が閲覧できるようになっていて、検索履歴表示の中から選択して、再利用できるか。
(11)検索システムの終了時に、作成した検索式の保存ができ、以後の検索機会の必要に応じて呼び出せるか。
C.検索結果の出力ならびに著作権はどうなっているか。
(1)ヒット件数表示、簡略表示、詳細表示、そして表示フィールドの指定などの確認の仕方。
(2)画面プリント以外に、どのようなフォーマットで、プリンタ出力ができるか。
(3)データの加工などに便利な、検索結果のダウンロードあるいは電子メール送信への対応、それらの著作権(「著作権の基礎知識」(c)1991-1997 Tadashi MATSUSHITA / http://www.furutani.co.jp)にどのような注意が必要か。
 図書館その他の組織の情報検索用の道具については、「パソコンのしくみ〜ハードウェア〜」(知っ得!パソコン塾)そのほか機器の導入から設定、「アプリケーションソフトウェア(IT用語辞典)」のインストールそのほか、何からなにまで納入業者まる抱えというのがほとんど。大学や研究機関では、コンピュータ・ネットワークや情報システムを扱う専門の部署があったりするから、情報検索担当者は検索のノウハウだけ知っていればいいさ、ということにはならない。
 とかく日常業務にはつきものの、ウィルス(トレンドマイクロ・セキュリティ情報)そのほかちょっとしたトラブル(「トラブルシューティング」パソコン初心者のサポート - MB-Support)への対応や、情報検索関連機器の更新要求の際など、コンピュータネットワークの基礎(「ネットワーク講座」Allied Telesis K.K. )を含めた基本的な知識について、時々リニューアルしていかないといけないね。
 

目次に戻る

03.図書や雑誌の所蔵や書誌情報そのほかを調べる

 図書館が所蔵している本や雑誌、その他のコレクションにどのようなものがあるか、それらの書誌・所蔵情報を調べるのに、OPACと呼ばれているオンライン蔵書目録を検索しなければならない。
 蔵書についてすべて2次情報化されていても、その目録情報がデータベース化されていない範囲については、従来のカードや冊子による所蔵目録を調べることになる。
 いずれにしろ、最初に注意しておかなければならないのは、雑誌はそのタイトルでしか調べられないから、目次や論文記事のタイトルや著者名の検索はできないということ。「雑誌論文の探し方」(横浜市立大学学術情報センター)については別の手段に頼り、見つけた論文が載っている雑誌名、その卷号数(入手にあたっては掲載ページ数も必要)などをOPACの書誌・所蔵情報と突き合わせ、入手について判断することになる。
 現物(コピー)入手を前提としたOPACの選択は、まず所属組織内(「富山短期大学付属図書館:Web OPAC」)の、そして隣接あるいは近隣の、次に全国の大学や公共の、それでもなかったら、国立国会図書館の、というように近くから遠くへ「図書所蔵情報・雑誌所蔵情報」(情報探索デスク)の検索範囲を広めよう。国内で見つからなかったら、海外のOPACを検索したり、よくよく書誌情報を確かめて身近な図書館の窓口で相談したほうがいいよ。
 とにかく「所蔵調査と文献の入手」(「文献を探す(基礎篇)」大阪府立中之島図書館)ついてどれだけ注意していても、し過ぎるということはにはならない、ということを肝に銘じておこう。
 情報検索の手始めとして、まず「図書の探し方」(横浜市立大学学術情報センター)のようなガイドから、本の探し方の基本が学べる。
 その応用編としてはそれぞれのOPACのヘルプなどを読んで実際に検索してみることになるが、インターネット上に世界各地の図書館のホームページが登場し、リニューアルされ、そこで公開されたOPACを実際に使ってきた図書館員の体験談「図書館の蔵書を調べる:#インターネット活用/体験コラム」(小関康幸)も参考にするといいね。
 図書館の本を横断検索したい場合など、「蔵書の横断検索」(Yahoo!JAPAN > 各種資料と情報源 > 図書館 >)が集めている試みを利用すると、国内の複数の図書館のOPACをある程度選択して、1回の検索実行で調べることもできる。
 国公私立そのほか、大学図書館の蔵書の所蔵については、全国規模のOPACデータ(「CiNii Books:大学図書館の本をさがす」は早稲田大学の蔵書データ「早稲田大学学術情報検索システム(WINE)」を含まない)で調べることができるが、全国の公共図書館や専門図書館の所蔵データについては「国立国会図書館サーチ」をはじめとした「図書所蔵情報」(情報探索デスク)から利用目的にかなったOPACを選んで調べるようにすればよい。
 海外の図書館の所蔵情報については、2007年の夏に公開された「WorldCat 」で、OCLCのWorldCatに収録された18,000を超える図書館の13億件のデータから調べることができる。
 まだ、どのようなOPACにも書誌・所蔵情報が見つからないような、新刊図書の情報などは、出版社や取次店そのほかのサイト「図書書誌情報」(情報探索デスク)で調べることができる。また、2003年の秋には「米アマゾン、書籍本文の全文検索サービスを開始」(Wired Archives)ということで、インターネット上でも洋書の“立ち読みが”できるようになった。
 OPACを使わない図書館の本の調べ方としては、OCLC(「OCLCの動向」H22NACSIS-CAT/ILLワークショップ荘司雅之)のデータベース「Worldcat」のレコードに、なんと「Google」からアクセスできるようにする実験(「OCLC Project Opens WorldCat Records to Google by Barbara Quint」Information Today, Inc.)も進められ、その後の「All of OCLC's WorldCat Heading Toward the Open Web by Barbara Quint」(Information Today, Inc.)レポートでは、「Yahoo! Search」も加わって、非図書館系のWebサイトから図書の書誌情報に関連した所蔵情報も調べられるようになってきている(「グーグルで図書館の本を調べた例」愛知淑徳大学図書館:司書の目と耳 June 14, 2005)。
 Googleは図書館の蔵書の目録情報だけでなく、海外の主要図書館の蔵書の閲覧を可能にする「Google Is Adding Major Libraries to Its Database By JOHN MARKOFF and EDWARD WYATT」(The New York Times December 14, 2004)サービスを公開する動きも見せはじめていたが、2005年11月から「Google books」を通じて、著作権争いにならないパブリックドメインの書籍や政府資料などの全文が調べられるようになった。「インターネット業界との協働による図書館蔵書のデジタル化計画」(「カレントアウェアネス-E」No.51 2005.01.19)の進展によって、「この本はあの図書館に」(ITmedia News 2006.08.26)ということが調べられるだけでなく、「L'Inferno di Dante Alighieri By Dante Alighieri, Francis Lawrance William Venables-Vernon Vernon」をはじめとした古典作品などがPDFでダウンロード公開され、図書の2次情報と1次情報が組み合わさったサービス(「Google Book Searchの機能拡張とミシガン大の新プロジェクト−図書の所蔵情報や本文データを用いた新たなサービスの幕開け」カレントアウェアネス-E No.91 2006.09.20)が利用できるようになってきた。
 国内でもAmazon.co.jpが2005年11月1日から、和書と洋書の本文を検索できるサービス「Amazon.co.jp: 本/なか見!検索とは?」をはじめているが、図書のコンテンツ・サービスも新しい局面を見せはじめている。
 2010年あたりから図書館における貸出サービスの対象になりつつある「電子書籍」(「電子書籍情報まとめノート」yamakai)については、従来の書籍とおなじように図書館における1次資料としての運用へ導く目録、電子資料の2次情報を繰り込んだOPACサービスが見込まれる。
 地べたの図書館で行われてきた新着図書等の展示・案内サービスのネットワーク展開としては、例えば「ウェブ本棚サービス「ブクログ」の図書館における活用」のように、館内所蔵情報をバーチャル書架に持ち出したようなサービスが行われている。

目次に戻る

04.Web版(CD-ROMの利用も含む)検索情報源で調べる

 音楽用に開発されたCD(コンパクト・ディスク)に文字や画像などのデータを収めたCD−ROMは、DVD-ROMとならんで、データベースだけじゃなく、コンピュータプログラムの配付や電子出版の媒体としても幅広く使われている。
 図書館における情報検索サービスの整備・拡充面で、高価なオンライン検索にとってかわる画期的な変化をもたらしたこともあったCD(DVD)-ROM利用の現状の一端は、たとえば「電子資料」(国立国会図書館:リサーチ・ナビ)などからうかがうことができる。
 1枚あたりの容量に限界(約600MBで新聞記事1年分)があるため、データ更新で増え続ける枚数の管理が大変だが、複数のドライブを備えたCD-ROMタワー(あるいはCD-ROMアレイ)と呼ばれる装置とCD-ROMサーバを用意し、学内LANを利用したCD−ROMネットワークでアクセスしやすくすれば、オンライン検索のように接続・検索時間や出力件数にともなう課金(従量制)など気にすることなく、利用者の情報検索環境を改善できたわけだ。
 最初からオンライン検索用に作成されていたデータベースへのアクセスの仕方が、ある分野のデータベースがCD-ROM形態でも提供されるようになったという時期を経て、WWWを利用したインターネット接続へと移行しはじめ、情報検索手段としての“CD-ROM離れ”といった傾向に注意しておこう。
 図書館の蔵書検索サービスの窓口となっているWeb版OPACでは所蔵雑誌に掲載されている論文や記事などは調べられない。
 「雑誌記事索引(国立国会図書館作成)」(日本の雑誌論文を探すための基本的ツール)としては「CiNii Articles:日本の論文を探す 」(国立情報学研究所)や「NDL-OPAC」(国立国会図書館)などが利用できる。
 停電時の調べものには冊子体の情報源がないと困るが、ネットワーク情報源が利用できない場合など、国立国会図書館の蔵書目録をCD[DVD]-ROM化した「J−BISC」をはじめ、CD-ROM版の各種情報源のスタンド・アローン利用が頼りになる。
 新聞記事情報の遡及検索サービスはCD−ROM版や冊子体の情報源で運用できても、速報性が要求されるとオンライン記事情報サービスに頼らざるをえず、例えば「聞蔵 DNA(Digital News Archives) for Library」(1984年8月以降の480万件にのぼる全文記事データベースの図書館限定サービス)を導入している図書館も多く、富短の図書館でも利用できる。
 「医学中央雑誌」(国内で発行されている医学・歯学・薬学およびその関連領域の文献を探すための基本的ツール)のようにCD-ROM版のサービスが終了し、「医中誌Web」のようにWeb版のサービスのみとなったものがあり、その利用について「「医中誌Web」クイックツアー」を見て、実際に「医中誌Webデモ版」で試してみよう。
 医学分野では早くから文献情報のデータベース化が進んでいて、「メドライン(Medline)」(フリー百科事典『ウィキペディア(Wikipedia)』)が国内の多くの大学、医療機関などで利用されてきているが、その「Medline CD-ROM」を導入した図書館の検索サービスの提供から、例えば「PubMed」に日本語の解説を加えて検索できるようにした「MEDLINE 日本語ゲートウェイ」に見られるような、Web版無料サービスの利用へと様変わりしてきた。雑誌記事や論文などの2次文献データの検索から原文献の入手までの流れについては、「「医療文献を調べるには」〜科学技術・経済情報室〜」[PDF](国立国会図書館)が参考になる。
 NLMが作成した「医学件名標目表」である「MeSH (Medical Subject Headings)」 は、上位語、下位語、同義語、そして関連語などを定義していて、「シソーラス」(フリー百科事典『ウィキペディア(Wikipedia)』)といわれているものだ。全文検索システムにおいても、「シソーラス」(IT用語辞典バイナリ)による言語処理が、重要な役割を果たしている。。
 MeSHとはどのようなものか、「PubMedのmedical subject headings (MeSH)について 」(神奈川歯科大学 森實敏夫)を見ると、「医学のさまざまな主題Subjectをツリー状分類して、それぞれの文献が、どの主題に相当するかを分かるようにするために,その主題を検索語としてそれぞれの文献に付けているのである。」というように図解してあるね。
 国内外の代表的なインターネット対応情報検索システム例としては、「サービス一覧」(G-Search)などさまざまな情報源が利用されているが、それらの導入が公共図書館サービスの電子化とどのようにかかわっているか「公立図書館における電子図書館のサービスと課題に関する報告書 2002 年度」[PDF](全国公共図書館協議会)を参考にしてみよう。

目次に戻る

05.オンライン(あるいはWWW)でデータベースを調べる

 検索時間や表示レコード件数に応じて課金(従量制)され、通信回線の速度や混み具合などに影響されやすいが、検索時点での最新データが入手できるという点で、数ヶ月に一度程度の更新頻度のCD-ROM(オンディスク)検索と比べることはできないメリットがある。
 アメリカでは1960年代から商業ベースでオンライン検索システムが開発され、1970年代前半になると「DIALOG」(G-Search)という商標のオンライン検索サービスの草分け的存在が出現し、後々からその小型版ともいえる「FirstSearch」(紀伊国屋書店[教育・研究機関向けソリューション] )が「OCLC」によって開発され、いずれも大学や研究所の図書館で広く使われている。ちなみに国立国会図書館の東京本館で利用できる電子情報提供サービスにどのようのものがあるか、「主なデータベース」の内容を見てみよう。
 国立情報学研究所が提供している情報検索サービス「GeNii(NII学術コンテンツ・ポータル)」に、富短は「機関別定額制」で参加しており、短大構成員はおおよそのところ無料で利用できる。手始めに「CiNii Articles:日本の論文をさがす」の「キーワードによる検索方法」を参照しながら、実際に試してみよう。
 また富短の学内LANから、国公立試験研究機関や大学、専門学校等の学術機関と、病院等医療機関などを対象とした「JDreamIII」(JST科学技術振興機構)にもアクセスできるから、医療情報を含む科学技術情報を調べるのに役立つよ。
 手元のパソコンや端末から、電話などの通信回線を経由してホストコンピュータに接続し、検索するしかなかった一時期を経て、今ではインターネット、なかでもWWWを使ったさまざまな情報検索があたりまえになってきて、オンライン検索という言葉自体も馴染みが薄くなってきたかな。
 古くからのオンライン検索サービス業者そのものが、昔ながらの公衆電話回線接続やインターネットのtelnetによる接続方式を残しながらも、次から次へとWWWによる検索サービスを提供しはじめ、さまざまな情報が氾濫するインターネット上で、学会その他で伝統的に信頼性が高い情報も得られるようになってきている。
 これらのデータベースで調べられるのは基本的にWebページ以外というか、従来の図書や雑誌論文の書誌を集めた2次情報や、記事・論文の全文データやファクト・データを収録した1次情報であって、主にWWW上の情報を調べたりするサーチ(検索)エンジンとは大きく役割が異なっていることに注意。
 こうしたデータベースを使う場合、営利・非営利の法人サービスを問わず、利用者が契約を結んで利用料金を払うというのが一般的だが、大学や研究所などの図書館が窓口となって契約し、組織内の学生・教職員や研究者が無料で検索できるようになっている場合もある。
 海外の学術文献を調べたくともそんな環境に恵まれない時など「IngentaConnect」だけじゃなく、査読論文、学位論文、プレプリント、書籍、テクニカルレポートなど学術的論文の検索用サーチエンジン「Google Scholar」や、科学雑誌はもちろん、未公開の研究資料、大学のウェブサイト、企業のサイト、会議の議題や議事録、ディスカッショングループやメーリングリストのアーカイブまで入り込んで検索を可能にする科学者向けの検索エンジン「Scirus: for scientific information only」のように、専門的な利用に特化された検索サイトを使って洋雑誌論文を検索することも日常的に可能になってきている。

目次に戻る

06.Webページ情報を調べる

 WWWを使った情報収集で注意しなければならないのは、Webページに書かれている情報が常に正しい情報であるとはいえないことだ。インターネット上には、さまざまな人や組織が出入りして大量の情報が発信され、その内容は信頼性の高いものもあれば不正確で信じがたいものまで、収集した情報内容をまず吟味しなければならない。
 とはいえ、数えきれないような情報がネットワーク上のあるということは、例えば「調べ方案内:リサーチ・ナビ」(国立国会図書館)に含まれるインターネット情報源を見ればわかるように、図書館のような情報を収集する立場としてはとても喜ばしいことなのだが。
 ところで、大学のリカレント教育で“インターネットは世界の図書館”なんてお話をさせられたこともあったけど、今日Web上で公開されている情報はどれくらいの規模の図書館の蔵書に匹敵するだろうか?
 ちょっと古いが、カール・シャピロ、ハル R・バリアン共著『ネットワーク経済の法則』(IDGジャパン、1999年発行)の22ページを開いたら、
 「端的に言えば、現代のとてつもない変化のスピードとインフォーメーション経済の今日的魅力は、インフォメーション・テクノロジーとインフラストラクチャの発達によってもたらされたものだ。インフォメーションそのものの性質や規模の基本的変化がもたらしたものでは決してない。実際にはこういうことだ。ウェブ上で公開されている静的なHTMLテキストの分量はほぼ百五十万冊の書籍に相当する。カリフォルニア大学バークレイ校の図書館には八百万の蔵書がある。同図書館にある蔵書内容の質の平均レベルはウェブよりもはるかに高いものだ。もしウェブ上の資料の十パーセントが「有益」なものだとすれば、約十五万冊の書籍に相当し、ボーダーズ(注/米国の大手書店)の一店舗の規模に近いことになる。しかし、「有益」なものの実際の数字はおそらく一パーセントそこそこで、これなら一万五千冊、つまりショッピングモールに店を構える書店の半分の規模だ。」(千本倖生監訳、宮本喜一訳)
 という指摘があった。
 ここで問題なのは、どこにどのような情報があり、それがいつ更新されたかということが誰にもまったく分からないということだ。そこへ登場してきた探索手段の一つがインターネット検索サービスと呼ばれるデータベースサービスで、「サーチエンジン登録ガイド:日本の検索エンジン」(大西利貢)や「検索デスク:横断検索と厳選リンクを集めたWeb検索のスタートページです」(searchdesk.com)を参考に、いくつかの系統に分けられた各サービスサイトの使い方を確かめながら実際に使ってみよう。
 インターネット上で情報を収集したいが、どこを探してよいかわからないようなときは、サーチエンジンやディレクトリサービスそれぞれの特質を理解し、それぞれのいいところとよくないところを補いあうような使い方をして、関連情報を探すようにしないといけないね。
 よりよい答えを見いだすためには、どのような質問の仕方を心がけねばならないか、いろいろと「 インターネットサーチエンジンのやさしい使い方」(Sun)を実際に試していくなかで、質のよいウェブ資源を見つけてリサーチに生かすためのテクニックを身につけ、その時々の目的にかなった検索のやり方を選択して調べる習慣を身につけよう。
 このような検索サービスによっていったいどれくらいの情報が得られるのか、「検索エンジンの補足率を推計する」(Yoshiki Mikami)方法によって、実際の検索結果による推定を試みることもできるよ。
 インターネットで求める情報を探そうとしても“コトバの壁がね”という場合には、すぐにあきらめたりしないで「翻訳と辞書:翻訳のためのインターネットリソース」などの助けを借りたりして調べることもできる。
 Webページで得た情報には、いつの間にかそのURLが変わったり、HTMLファイルそのものが消えてしまったりすることがよくある。元のURLがわかっていたら、1996年から現在まで保存されたWebページからそのWebサイトの歴史が表示される機能を持った「Wayback Machine」を公開している「Internet Archive」で探しだせる場合もある。必要なら「Internet ArchiveのWaybackMachineで過去のasahi.com」を見たり、ニュースサイトのWebページを振り返ることもできるよ。
 とにかく何十億もあるWebページから必要な情報を探しだすには、サーチエンジンのカスタマイズ「Fagan Finder > Web Search Engines >Google」例のような自分専用の検索フォームの作成だけじゃなく、例えばWeb上の新聞や雑誌記事などの「著作権表示」を手がかりに、検索対象紙(誌)を特定した主題検索を試みたり、

表06-1 Googleによる著作権表示を識別子とした新聞などの記事検索入力例
検索対象記事 著作権表示例 Google入力例
毎日新聞 Copyright 2003-2004 THE MAINICHI NEWSPAPERS. All rights reserved. "Copyright * * THE MAINICHI NEWSPAPERS" “[キーワード]”
日経新聞 (C) 2003 Nihon Keizai Shimbun, Inc., All Rights Reserved. "(C) * Nihon Keizai Shimbun, Inc." “[キーワード]”
朝日新聞 Copyright 2003 Asahi Shimbun. All rights reserved. "Copyright * Asahi Shimbun." “[キーワード]”
読売新聞 COPYRIGHT THE YOMIURI SHIMBUN "COPYRIGHT THE YOMIURI SHIMBUN" “[キーワード]”
Yahoo! JAPAN Copyright (C) 2004 Yahoo Japan Corporation. All Rights Reserved. "Copyright (C) * Yahoo Japan Corporation." “[キーワード]”
Scientific American 2004 Scientific American, Inc. All rights reserved. "Scientific American, Inc. All rights reserved." “[Keyword]”
The New York Times Copyright 2003 The New York Times Company "Copyright * The New York Times Company" "[Keyword]"

するだけでなく、サーチエンジンがサポートしている検索構文の効果的な使い方によって検索結果を絞り込まないといけない。
 とりわけ効果的なのは、キーワードそのものをより専門的なものにするというより、サーチエンジンそれぞれの「特別構文」(特殊演算子)を使って、キーワードがWebページのタイトルやURLだけに含まれたWebページを検索する方がうまく絞り込めるということだ。
 ここまでいろんな検索演習問題を解いてばかりだったが、今度は逆に、例えばGoogleがサポートしている、「intitle:[Webページのタイトルに検索対象を限定して検索する]」、「intext:[Webページ本文のテキストを検索対象として検索する]」、「inurl:[WebページのURLに検索対象を限定して検索する]」、「inanchor:[Webページのリンク元のリンクアンカーの説明文を検索する]」、「insite:[サイトかトップレベルドメインのどちらかに検索を限定する]」など特別構文の使い方を工夫をしたりして、それぞれが「情報サービス概説」の授業で試作したパスファインダー作成課題の、改定と更新に役立つWeb情報源を集めてみよう。
 これからは、インターネットを探索する端緒となった検索ポータル・サイトはWebページ情報だけでなく、しだいにその検索対象とする情報源の窓口を広げはじめ、「Googleが図書館に与えるインパクト」(一橋大学総合情報処理センター:兼宗 進「カレントアウェアネス」No.285 2005年9月20日)とレポートされるまでに、情報検索の現在に食い込んできている状況も視野に入れておかないといけないね。

目次に戻る

07.電子ジャーナルや分野別情報が入手できるサイトを調べる

 たとえば学術情報のように、信頼性が高い最新の情報を調べるのに使われてきた、抄録索引誌あるいはデータベースに収められているのはあくまで書誌情報であって、検索して見つけた文献は掲載されている雑誌や図書を探しだして読むしかなかった。
 ところが、近年になって、大手の学術雑誌出版社の多くが雑誌論文そのものを電子化し、インターネットを通して見られるようにしている。これを電子ジャーナルあるいはオンライン・ジャーナルといっていて、なかには冊子体がなくてオンラインでしか読めないものもあったりする。学術雑誌論文の電子化の流れについては、「電子ジャーナルの出版・契約・利用統計」(「カレントアウェアネス」No.278 2003年12月20日)などで、その動向を確認しておこう。
 当初は冊子体購入の付録みたいな扱いだったが、今では大学や研究所の図書館(「電子ジャーナルの利用法 〜基本編〜」京都大学図書館機構)などが代理店や出版社と価格交渉して、サイトライセンスその他の契約を結ぶのが普通になってきている。すべてが有料ということもないので、とくに調べたい文献の書誌事項がはっきりしている場合など、「CiNii Articles:日本の論文をさがす」の「全文検索(beta)」を試したり、「原報情報」(情報探索デスク)で紹介されているように、原文献にアクセスできないか試すことも忘れてはならない。
 このような電子情報資源の図書館への導入が進むだけじゃなく、デジタル化の進展によって図書館を経由しない情報流通手段も出現してきている。こうした環境変化の中で、ドキュメント・デリバリー・サービスを担ってきた図書館等の公的機関は、そのサービスの在り方を再構築していく必要にせまられているといっていいね。
 Webを利用した、新しい、情報送付システムの登場によって、2次情報を介さずに膨大なコレクションにアクセスして調べられるようになるなど、その他インターネット上の情報源を調べるにしても汎用的な検索エンジンがすべてとはいえず、専門分野に特化したサイトの情報などが、各種資料や情報源へのリンク集としてあちこちの図書館のホームページ(「日本国内の大学図書館関係WWWサーバ」(東京工業大学附属図書館)、「公共図書館(公立図書館)」(日本図書館協会)でも紹介されるようになってきているからいろんな実例を調べてみるといい。
 そのほか、このページのタイトル・フレームにリンクしてある“情報探索デスク”の「主題別・各種リソース情報/レファレンス情報」などからアクセスできるサイトで、具体的にどのような資料(情報)が調べられるかいろいろ確かめてみよう。

目次に戻る

「図書館の情報検索@インターネット情報源」kyoshi@tym.fitweb.or.jp  2013.09.22