皓星社(こうせいしゃ)図書出版とデータベース

第2回 ネット上で確からしい人物情報を拾うワザ――国営の典拠DBを人名事典として使う

 - 

小林昌樹(図書館情報学研究者)

 

本を読んでいたり、書きものをしていて困るのは、自分の知らない固有名、とくに人名が出てきた時だろう。織田信長、吉田茂などの超有名人なら、広辞苑や百科事典、人名辞典を引けば出てくるし、ネットならGoogle経由でウィキペディアをすぐ引ける。しかし、それらで見つからない時にどうすればよいか。

■人物調査の三類型

実は、人物情報の調べは、有名人、限定的有名人、無名人の3つに分けて調べると効率がよくなる(これは私が16年前に発見したノウハウ)。

 

・表1 人物調査の三類型

 

 

 

 

 

 

 

 

 

 

 

 

 

いままで物を書く場合などで出ずに困っていたのは、みんなしてa有名人――むしろ「超有名人」というべきか――用の、人名事典類を引いていたからである。本などに出てくるのに経歴が不明で困るような「限定的有名人」はbの、時代業界限定の紳士録類を引かないといけなかったのだ。レファ司書の重要な仕事は、こういった問い(を発する人が、答えが載っていると思いこんでいる資料)と答え(が実際に書いてある資料)のミスマッチを交通整理することだ。

 

■無名人の調べはケモノ道だが、半有名人の調べは?

ところで、無名人はそもそも調べるニーズが発生しない一方(ルーツ探し、ファミリー・ヒストリーは別)、情報は非公刊のものや、マル秘ではないがアクセスしづらい「灰色文献」にしか載っていないから、てんから「サーチ」(検索)の枠組みを外れて「サーチ」(調査・研究)になってしまう。時間や手間が十二分に必要で、「レファレンス」の枠を外れていく。つまり、レファ司書が直接助けられない領域に突入していく。まぁ最低限公刊資料で調べられることもあるのだが、それは別項で。

無名人に対して「限定的有名人」――ここでは「半有名人」と呼ぶ――、つまり時代や業界限定でそこそこ有名だった人たちは、基本、公刊資料でなんとかなるので、図書館的なツールの出番、ということになる。

 

○限定的有名人の「限定」がキモ――どの時代、どのジャンルかをGoogleブックスで

さて、超有名人でない限定的有名人、つまり半有名人は、時間や場所、業界や知識ジャンルなどの枠内で限定的に有名なわけで、その限定ジャンルが明確になれば、これはもう半分答えが出たようなものである。

Googleブックスで人名検索をする意義は、文字化けでグチャグチャのテキストを解読することではなく、その人名がどの時代のどの知識ジャンルに属するか、アタリをつけられる点にある。2、3万冊ある定番のレファ本のどれを引けばよいかが、Googleブックス検索でわかるわけだ(Googleブックスの用法もいろいろあるが別項としたい)。

 

○半有名人用のレファ本もあるが……。

実はこういった半有名人についての調査ニーズは、戦後になって日本では一部のレファ司書が気づき、紙のレファ本が開発されてきた。その最初は大植四郎編『国民過去帳:明治之巻』(尚古房, 1935。明治に没した2万名収録)の索引つき復刻であり、現在の代表例は日外アソシエーツが刊行する「人物レファレンス事典」類である。これらのレファ本は一通り、例えば永田町の国会図書館でも人物資料の棚に集中的に開架されていて、それらを効率よく――そう4,5点ひけば――半有名人調べは一応できたことになるのだが、昨今のコロナ禍では永田町へ行くのもままならぬ。

 

■契約DBと無料DB

Googleブックスとレファ本2万冊のあわせ技でもなんとかなる、というかそれが司書の王道なのかもしれぬが、「半有名人がわかるオンラインDBがあればなぁ」と、私なぞナマケモノだからすぐ考えてしまう。

実はこれがある。それは日外さんが提供しているDB「WhoPlus」で、同社初期の人名系レファレンスツール『現代日本執筆者大事典』(1978,以後2015まで全5期刊行)、『年刊人物情報事典』(1981~1984)、『昭和物故人名録 : 昭和元年~54年』(1983)などのデータを統合してスタートし、新聞記事(訃報も含む)を中心にデータの追加・更新を重ねているそうで(32万名分)、これからいろんな時代、ジャンルでデータを吸い出し、多彩な人名事典を作っているらしい。人物レファレンス事典の中身50万人分もplus(プラス)されていて総計82万名分を引けるという。

しかし我々は在野研究者なれば、そうそう契約DBを引くわけにもいかない。だいたい永田町へ登館したって、国民向け部門は契約していないからWhoPlusを引けない。すると。

WhoPlusに匹敵し、なおかつタダで引けるDBはないものか……と、さらに虫のいい考えが心に浮かぶ……。それが、ここだけの話、一つだけあるのだ。今回紹介する

Web NDL Authorities(国立国会図書館典拠データ検索・提供サービス)

である。

 

○「典拠」とは何か――おなまえのコントロール手段だった

官立直営事業らしく、長い名前の割にはなんだかよくわからない。「NDL典拠」という略語を勝手に作って説明する(組織としては「Web NDLA」としたいらしい)。

まず典拠(オーソリティー)とは、NHK「日本人のおなまえっ!」よろしく、人や団体、事物の名称を整理して「同じものにはこの形を優先的に使いましょう」と登録した表現形のこと。同名異人が区別され、別名(ペンネームなど)で活動する人が関連づけられる。

最初に作られたのは著者名だけの典拠で、図書館でカタロガー(目録屋さん)が新着図書データを作る際の参照用のファイルに編成していたのだった。1980年代末に慶応大学図書館で事務用カード目録を見たことがある。だから、最初は「著者名典拠録」などと呼ばれていた。その後、団体名や件名(事物名)に拡張されて、「名称典拠(name authorities)」などと呼ばれるようになった。日本の国立図書館でも編成していて、それをデータベース(DB)に仕立て直したのがNDL典拠。

米国図書館界で大昔に開発されたカラクリだったんだけれど、これを今回、半有名人の事典として使っちゃおう、ということである。国内ではNDLのほかに国立情報学研究所(NII)、図書館流通センター(TRC)が大規模に作っているはずだが詳細は知らないので省略。

 

■試しに使ってみる――ある図書館員の没年は?

「そうそう、日本流〈セルフ・レファレンス〉を提唱した都立図書館員の“斎藤文男”さん、最近亡くなったと思ったけど、いつだったっけ?」といったような場合、引く(ひらがな、カタカナでも引けるが、その場合、姓名の間に空白を入れる)。すると図1のような結果が出る。

 

・図1 検索結果一覧

 

 

 

 

 

 

 

 

 

 

 

 

 

あれ? 2人出るが……。まさか昭和7年生まれではなかったろうから25年生まれのほうだよね、と選択してクリックすると。

 

・図2 詳細画面 ある図書館員の場合

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

没年が2013年だったとわかる。意外と前だった。このようにNDL典拠を引くと、ある業界でちょっと有名だった人の没年が分かるのである。

我々にとって重要なのは「出典」のフィールド(欄)で、この典拠データは『資料提供としてのレファレンス・サービス』(1999年11月刊)という本を整理した際(2000年3月2日)に作られ――当時、データ作成まで3ヶ月以上のタイムラグが発生していたこともわかる――人名の読み(図書目録法にいう「固有の読み」)が「サイトウ,フミオ」であると「本人回答」で確認したこともわかる。奥付に生年がなければそれも本人に確認していたはずである。そういえば昔は電話や葉書で確認していた。

没年は2019年に本が出た際に奥付かなにかで確認したとある。死後に本が出て、そこに没年情報があれば典拠に追記される、というわけ。

 

○人名事典としてわかる要素

明治以降、およそ本を書いた日本人ならば誰でも全員、このDBに登録されているのが建前で(国会図書館に著書や伝記の所蔵があれば、外国人も入る)。上記例のように業界でちょっと有名だった人は本の1冊でも書いたり、編纂したりしているので、まさに半有名人、限定的有名人の多くがこのDBで最低限の情報がわかろうというもの。

最低限の情報とは、人名読み、生年・没年、著作から暗示される活躍ジャンル(職業など)である。また、上記例にはないが、ペンネームや雅号を使っていて、それがどこかでこの人だよと公表されている場合には、別名もわかるし、別名から検索することもできる。

右にあるボタン「著者名検索」で著作図書リストが、「件名検索」で伝記本のリストが自動生成されるが、有名人はともかく、半有名人は単行の伝記はないのが普通なので、限定的有名人調べには、あまり役にたたない。それは「外部サイトへのリンク:Wikipediaで検索を行う」も同じである。逆に有名人(図3)なら「件名検索」で伝記や研究本を探したり、「Wikipediaで検索を行う」のも有効だ(実際にリンクを踏んで動作を見られよ)。

 

・図3 有名人の例 ある作家の場合

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

○英語がわかれば、外国の日本人データを使って

意外と使えるのが「関連リンク/出典:NDL|00716055 (VIAF)」といったリンク。これは、バーチャル国際典拠ファイル(Virtual International Authority File: VIAF)へのリンクで、要するに他国の国立図書館が作っている同様のデータへ飛べるリンクのこと。

 

・図4 「関連リンク/出典:NDL|00716055 (VIAF)」から飛んだ先

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

例えば私の典拠データから米国の議会図書館データへ飛ぶと(上記図4の星条旗をクリック)、出典の項目に次のように出てくる。

>>

Sources
found: Zasshi shinbun hakkō busū jiten. Shōwa senzenki, 2011:t.p. (小林昌樹 = Kobayashi Masaki) colophon (r; b. Tōkyō, 1967; grad., Keiō Daigaku Bungakubu; librarian, Kokuritsu Kokkai Toshokan)

<<

これは、2011年刊行『雑誌新聞発行部数事典:昭和戦前期』の奥付によると、1967年東京生まれ。慶應義塾大学文学部卒。国立図書館司書だ、という意味である。

日本の典拠ファイルでも以前は同定用に職業を記載していたはずだが、今は見えない。海外の国立図書館などに所蔵されるような図書を出していれば、米国などのデータからそれを補完できるわけである。

 

○もう一つチップスを――典拠で拾ったデータからググり直してみると、さらに確からしい情報がゲットできる

米国図書館界で「パールグローイング法」というらしいのだが、すでにゲットした確からしい情報から、知りたいことをだんだん大きくしていく方法を取るのに、このNDL典拠が使える。

このDBもそうだが、近代人は生年はわかるのに没年がわからないことが多い。さきにNDL典拠で、正しい生年を掴んでおいて、それと人名でGoogleなどを検索すると、Wikipediaをはじめ、相対的に確からしい記述を見つけやすくなるだろう。また、それでノーヒットであった場合、ネットではまだ没年はわからない――あるいはまだ生きている可能性がある――ということも言うことができるだろう(司書が業務として行うレファレンスならば、この先に必ず新聞DBで訃報を探すというプロセスとなる)。

いまGoolgeで「斎藤, 文男, 1950」で検索すると「74年埼玉大学卒、東京都入都。〜2000年東京都退職、富士大学へ」といった滋賀県立図書館のデータがヒットする。没年だけでなく確からしい略歴もわかったりする。

 

■NDL典拠で気をつけるべきこと

○戦前データの多くは「常識読み」

NDLは戦前はなかった役所で、それに相当するものは「書籍館」(明治5年創設)に淵源をもつ「帝国図書館」だったけれど、もう規模が段違い(戦前は定員で1/10以下)。それで国立図書館がやるべきなのに戦前はできなかったことがいろいろある。その中でも全国で共有すべき書誌データを作る、という任務ができていなかったことは特筆されよう。もちろん、典拠ファイルもなかった。

いまNDL典拠で提供されている戦前著者分は、だから、1980〜90年代に遡及的に作ったものである(図5)。生没年もなく読みも「常識読み」であることが多い。ただし2000年代後半からのデジタル化に伴う著作権消滅調査の関係でデータが追記されているものもある。

 

・図5 戦前人物の例 ある図書館アクティビストの場合

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

図5の人物はNDLにない『文献継承』というPR誌で生没年がわかるのだが、少なくとも図書の復刻などはないので担当が自動的に気づくことができず、遡及入力された時のままのデータになっている(「名称/タイトル」系のフィールド以外、例えば「注記」欄は検索できないようだ)。

 

○生没年

2005年から、奥付の著者紹介などに記載されていても、新規のデータで生年を公開しなくなった。これがいいことなのかどうかは、今はわからない。

 

・図6 同名異人の例 2005年以降の新規データから生年がつかない

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

○出典欄

半有名人に「件名検索」や「Wikipediaで検索を行う」はほぼ無効なことは述べた。そこで重要になるのが出典欄である。ほとんどが最初の著作(の奥付)だけが情報の出典として記載されるのだが、しばしば他の出典、たとえば「著作権台帳」などの情報源が記されていることがある。この情報は重要で、1冊まるまるその人の伝記でなく、短い記事でもその人についての記事(「人物文献」と戦後のNDL職員が呼び始めたもの)がそこに載っていることを示す。つまり「人物文献索引」として機能するわけだ(図7)。

 

・図7 出典欄が人物文献索引として機能する場合

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

■関連するレファ本、同様のDB

我々は国立図書館のカタロガーではないので、以上のように、知りたい人物だけを引き、使えるフィールドだけ読めばよいが、人名事典として使う範囲内で必要な全体・関連情報についても説明しておく。

 

○収録人数がケタ違い→半有名人の調べにピッタリ

NDL典拠にどれだけ収録人数があるか? 調べたがよくわからない。2011年段階で団体名や件名(事物名)を入れて100万件とあるから、その後の増加も考えて人名も100万名くらいはありそうだ。日本最大の『大人名事典』(平凡社, 1953-1955, 10巻)で5万名、明治の『国民過去帳』で2万名、紳士録の類で同時代現役の人物、約9万名だから(『参考図書の選び方』日本図書館協会, 1979, p.114)、文字通りケタ違いの収録人数である(ただし、NDL典拠もWhoPlusも、日本語訳が出た外国人などを含んでの数である)。

もちろん契約DBとしてもっとも広汎な人物DB「WhoPlus」は82万名を擁し、これは単行本著者に限らないわけだから、物を書かなかった人、記事しか書かなかった人が含まれ、必ずしもNDL典拠>WhoPlusとは言えない。また、2万5千人を収録する「近代文献人名辞典(β)」といった典拠ファイルとほぼ同じ発想の在野DBも最近公開され、こちらは米国データを参照しなくとも、略歴もある。

また、海外の契約DB、World Biographical Information System (WBIS) Onlineも、日本人の半有名人を調べるのに使える(ローマ字でだが)。これには、各国紳士録のデータが片っ端から入力されており、当然、日本人も英文Who’s who(紳士録)データが明治期から採録されているからだ。このDBは職業から検索できるところもよい。

明治より前の著者を調べる場合、典拠はないの?→『和学者総覧』と『漢文学者総覧』をセットで引くとか、そもそも5万名ほど収録されていた『文化人名録/著作権台帳』(日本著作権協議会, 1951-2001)はどうして無くなったの?などということは、長くなる。要望があれば別項としたい。

関連サイトのリンク集は、とりあえず、1回目で紹介したNDL人文リンク集の人物・肖像の項目を参照のこと、と書こうとしたら、WhoPlusや近代文献人名辞典(β)が立項されていないので、今回あまり参考にならない。さすがにNDL典拠は列挙されている。

図書――ほぼ単行本のこと――を出した人だけ、という限定はあるけれど、明治以降の著者、全員の基礎的情報が載っている(建前だが)。それがNDL典拠なのである。

 

○補記(司書向け)

改めてオーソリティーって何だろうといろいろ文献を見たが、あまりいいものがない。ハテ、なんで自分はそのコンセプトがわかるんだろう?と自分に問うてみると、おそらく次の連載を読んだことがあるからだろうと気づいた。

・横山幸雄「典拠とは何か(典拠コントロールの世界(1))」『びぶろす』45(4) p.20-21(1994.4)

 

■次回以降の予告

今回も前回同様、記事が長くなってしまいました。本当はチップス(小さいノウハウ)の連載なので、もっと短くしたいです。その場合はNDL人文リンク集にあるユースフルなサイトの解題や、あの並びをどう使うか、といった記事もつけると面白いかもしれません。

ネットで期待が表明されているのを見て、いろいろ考えています。皓星社公式Twitterアカウント(@koseisha_edit)上で、以下の項目より幾つかを抜き出し、近々アンケートをとる予定です。是非ご回答下さい。

・Googleブックスを使う場合気をつけること:ページ数誤植 フレーズ 旧漢字

・要素合成検索法:下位要素をとにかく2つ

・キーワード置き換え法:普通名詞>固有名詞変換法、わらしべ長者法

・ノウハウにも大きさがある:汎用度の問題、

・日本語文献の形態別時代別残存率について:文献参照の困難さを事前予測する

・未知文献検索 日本語件名の本当の使い方(NDLSH細目の不備をどう補完するか)

・この世にどんな使えるツールが現にあるか:参考図書編 NDL ONLINEを使って

・「として使う」法 eg. 新聞DBを百科事典として使う

・索引の排列 よみ、ローマ字、電話帳式 letter by letter word by word

・雑誌記事索引、新聞記事索引の採録年代比較

・ヨミダス検索の秘孔を衝く:概念索引と自動索引と

・戦前の新聞記事を見つける:日付確認法+東京五大新聞、新聞集成

・江戸時代など新聞のない時代の新聞記事情報もどきを探す方法

・無名人のことを公刊資料で調べる:探偵一歩手前

・前近代日本の著者名典拠はないの?

・答えから引く法 eg. 頼朝の刀の銘は?

・ざっさくプラスの得失:総目次「細目」から入力された戦前文芸雑誌

・Library pathfinder(調べ方案内)の本当の見つけ方、使い方、読み方

・レファ協事例の読み方、活用法:事案を事例に1段階抽象化する方法

 


小林昌樹(図書館情報学研究者)

1967年東京生まれ。1992年国立国会図書館入館。2005年からレファレンス業務。2021年に退官し慶應義塾大学文学部講師。専門はレファレンス論のほか、図書館史、出版史、読書史。共著に『公共図書館の冒険』(みすず書房)ほかがある。詳しくはリサーチマップ(https://researchmap.jp/shomotsu/)を参照のこと。

 

☆本連載は皓星社メールマガジンにて配信しております。

月一回配信予定でございます。ご登録はこちらよりお申し込みください。