皓星社(こうせいしゃ)図書出版とデータベース

第五回 明治期からの新聞記事を「合理的に」ざっと調べる方法

小林昌樹(図書館情報学研究者)

■新聞紙*自体のこと

幕末明治から新聞紙が作られてきた。図書館にもそれらは備えられたのだが、通常、消耗品として廃棄され、帝国図書館ですら主要紙の保存に留まった。新聞紙の史料としての価値に気づいた畸人・宮武外骨が明治新聞雑誌文庫(東京大学)を開いたのは昭和2年のこと。

新聞紙も保存されるようになったのは、戦後、国会に国立図書館が移されて規模が10倍になってからだった。政治史にはあまり役立たないが、しかし新聞記事は、文化史、社会史、風俗史、生活史、ファミリー・ヒストリーに絶大な威力を発揮する。

ところが、新聞紙は図書と異なり、様々な事柄、雑多な記事が載っているのに索引がない。後から史料として使う場合には、雑多な記事をどう見つけてくるか、という検索法が決定的に重要になってくる。

それなりの探し方がある場合、一部図書館業界では「合理的な検索手段」があるという。実際にはそれがないのでレファレンス質問を謝絶する場合に使うフレーズだが。

いま、合理的に検索できる新聞記事の、おそらく千倍、万倍、それ以上の記事が国会図書館(NDL)の地下書庫や東大に死蔵されていると思うが、これらを見るのでなく引くようにできるまでにはまだ二三十年かかるだろう。それまでの過渡期としての現在を説明する。

 

* 大正末にnewspaperのことも「新聞」と呼ぶようになったが、それまで「新聞」(news)と「新聞紙」は分けて表現されていた。新聞記事(newspaper article)を探す方法と、新聞紙を探す方法は、ほぼ違うノウハウである。

 

■記事を検索する手段は3つ

いま、記事を合理的に検索する方法は3種類ある。下に表1「記事索引の採録年代イメージ表」を掲げるので、それを見ながら読んでほしい。雑誌記事索引と一緒の表なので、黒枠内の新聞記事の部分である。

・表1 記事索引の採録年代イメージ表

 

一つは大新聞社がやっている自社記事検索DB(表1のi)。これは現状ではいちばんポピュラーなもの。いま一つは伝統的に開発されてきた「新聞集成」と呼ばれる図書(j)。もうひとつは新聞スクラップの延長上に作られたDB(k)。

この三種以外にさらに伝統的な手段として新聞縮刷版もあるにはあるが、横断索引がないに等しいので**、合理的に引くにはいまひとつである。

 

** 朝日新聞のみ、1912(大正元)年からの人名索引がある。『朝日新聞人名総索引』(日本図書センター 2004、5巻)

 

■新聞DBの引き方

○DBは戦後の三大紙***にそれぞれある

日本の三大紙は読売、朝日、毎日とされどれも戦前から歴史ある新聞で、どれにもDB版があるが、ぜんぶ契約DBなので基本はどこかの図書館で検索するということになる。

 

*** 「三大紙」というのは戦後のこと。戦前のことを調べる際には大正期からの「東京五大紙」といった古い枠組みを気にかける。『東京日日新聞』『報知新聞』『国民新聞』『時事新報』『東京朝日新聞』。また戦前、新聞マスコミは大阪圏と東京圏で違う世界が分立していた。例えば「東京日日」は「大阪毎日」の東京版にあたるが(1911年買収)、記事内容には異同がある。

○記事データの構成

どのDBも記事データの全体構成は同じ。というのも、どの社も1980年代半ばから記事をコンピュータで作り始めたため、そのデータを再利用して全文DBを用意する一方(仮に「現在記事」と呼ぶ)、それ以前の部分は、データ化された版面(刷り面)を画像として用意し、別に作られた論題データ(記事索引、メタデータ)をマッチングさせることで、過去記事を検索、表示させることができるようになっているからだ。

 

毎索の戦前分が、版面がありながら事実上、ほぼ検索できないのは(****)メタデータがごく一部しかないからである。

戦前も含めて記事を探す場合は、ヨミダスと聞蔵を引くことになるのだが、ヨミダスのほうが引きやすいインターフェイスである(聞蔵もまねてほしい)。また、採録記事の幅もなんとなく広い感触がある。読売新聞は戦前、読書に力を入れていたこともあり、図書館で業務として検索する場合には、ヨミダス>聞蔵の順で検索していた。そこで、とりあえずヨミダスの説明をメインにして、新聞DBを説明する。

 

**** メタデータがないと「事実上」検索できない。【毎索の戦前分】画像データはあるが、メタデータ付与がごくごくわずか。遡及的に整備しているらしい。【聞蔵の1888年切り替え】1888(明治21)年7月以前、朝日新聞は「大阪朝日」しかないのでメタデータも大阪系記事しかないが、逆にそれ以降は「めさまし新聞」を買収・改題した「東京朝日」のメタデータしか作っていない。

 

○広告も記事として引ける――ただしデータ構成の断層に注意

ヨミダスの場合、1874(明治7)年から1989(昭和64)年まで版面画像と記事索引のセット、1986(昭和61)年以降がフルテキストの構成になっている。

昭和61年以降のフルテキストはタブ「平成・令和」で検索できるが、上記のとおり本文作成の副産物なのでタブ「明治・大正・昭和」のほうでできる広告検索ができない。聞蔵のほうは1999(平成11)年まで版面+索引のデータがあるので広告も検索できる。

だから例えば社会現象にまでなった写真集広告が、ヨミダスでは直後の記事本文を検索して知るしかないのに(冊子の縮刷版を別途、見ないといけない)、聞蔵だと次の記事索引データから版面が直接見られる、という場合も出てくる。

 

ただし1986年〜1999年の13年の差を除けば、一般傾向として、聞蔵よりヨミダスのほうが広告記事も広くヒットしやすい気がする。これがもともとの掲載傾向なのか、索引採録の深度の問題なのかはわからないが。

他にも、例えばヨミダスでヒットする図1の広告から、日本初の多層ビル型書店だった大盛堂の、フロアごとのジャンル構成がわかったりもする。広告は、社史のない会社の歴史を調べる手がかりである。

 

・図1 大盛堂書店(渋谷)の広告(1959年) / ヨミダスより

 

また、これは『日本書籍総目録』類(Books in print)の代替として開発されたもので、出版広告だけを採録するDB明治期出版広告データベース(国文学研究資料館)もある。旧図書館学では広告の検索はあまり考慮されていなかった。そのせいかどうか、ヨミダス、聞蔵ともに広告記事のメタデータは見出し(的な広告文)を採録しているだけで、キーワード付与されていないのが残念だが、やむを得ない。しかし、広告も記事として検索できれば、社史、文化史、風俗史に一級の史料となる(そのうち社史のない中小会社・商店を調べるネタもやる予定)。

 

○事例でわかる「概念索引法」の得失

次のような質問に答える過程でヨミダスの特性を感じたことがある。

「2枚の絵を見比べて間違いを探す「間違い探し」は、いつ・誰が考案したのか」

https://crd.ndl.go.jp/reference/detail?page=ref_view&id=1000288936

回答文を読むとそこはかとなく、2枚絵を比較する間違い探しは、複数コマの漫画から自然発生したが戦前は確立することなく(図2)、1965年ごろ米国新聞漫画で確立したものが1975年に読売新聞に輸入されたことがわかる。また1960年代に藤子不二雄らが先行的に輸入していたらしいことも。

・図2 間違い探しの先行事例(1937年) / ヨミダスより

※見出し「ケンシヨウマングワ 空襲」にないキーワードが別途付与されている(表示はされない)

 

ここで、様式として確立せず、呼び名も不明確だった戦前の「間違い探し」先行例が見つかったのは、新聞DBの過去記事分が図書館学でいう「概念索引法」でキーワード付与されていたからである。図2のマンガに現代人がキーワードを振ったので今の意味での「間違い探し」が付与されていたわけである。

概念索引法は自動索引法の対概念で、要するにコンピュータでなく、人間が読んでキーワードを振る索引法のことだ。現代の人間が目視してキーワードを振るので、現在の意味で「間違い探し」と認識された記事が引っかかることになった。この言葉は記事版面のどこにもないにもかかわらず。言い換えると、いろんな風物の起源さがしや、先行事例探しに過去記事の索引情報が使えるわけである。逆に、本文中に特定の言い回しを探るといった用例検索には、1980年代半ば以降の現在記事(本文検索)の部分しか使えない(一応、過去記事の見出し部分も使えるが)。

 

■新聞集成を引く

○新聞集成とはレファ本の一種

日本では1919年、朝日新聞の杉村楚人冠が新聞紙の縮刷版を作り、冊子ごとに目次も付いて大変好評だったが、それでもなおカレントユースのためのもので、何年も蓄積して横断検索するものではなかった。しかし、昭和初年あたりから、大過去の新聞記事が「史料」として使えることが梅原北明などに気づかれて作られるようになったのが「新聞集成」というレファレンス図書である(表1のj)。

これらは主要新聞紙から主要ないし編者の観点からセレクトされた記事が年代順に転載され、それらが何冊ものセットで出版され、ぞれぞれのシリーズごとに索引巻がついて検索できるようになったもの。多くの場合、記事の写真版でなく翻刻された記事である。

これらは各新聞紙から採録されるので、例えば戦前の場合、「東京五大紙」からも採録されており、時事新報、國⺠新聞、報知新聞は現在、新聞集成からしか検索できないわけである。

ただし、気をつけないといけないのは、本文が改変・省略されていることがあるのと、明治初期の記事論題はもともと存在しないので(いきなり本文から記事が始まる)、論題がある場合は編者が新規に作ったものであることだ(ヨミダス等でも初期記事は同様)。

 

○新聞集成の系統

主な新聞集成にはA〜Cの3系統がある。Aは引きやすさに定評があり、Bは出版者が毎日系だが主要紙をきちんと採録。

A (元祖)新聞集成 中山泰昌(1884-1958)が創始

・明治編年史編纂会編『新聞集成明治編年史』財政経済学会, 1934-1935. 15冊 1935年林泉社版、1982年本邦書籍版あり

・『新聞集録大正史』大正出版, 1978. 15冊

・『新聞集成昭和史の証言』本邦書籍, 1983-1992. 20冊ニュース事典

B ニュース事典 毎日新聞社系の毎日コミュニケーションズが出した

・『明治ニュース事典』1983-1986 9冊

・『大正ニュース事典』1986-1989 8冊

・『昭和ニュース事典』1990-1994 9冊

C 新聞編年史 ※総索引がない!

・明治大正昭和新聞研究会編『新聞集成大正編年史』大正昭和新聞研究会, 1966-1988. 44冊

・平野清介編『新聞集成昭和編年史』明治大正昭和新聞研究会, 1955-継続中. 100冊以上

 

Cに索引巻がないので、一昔前なら、Aの3点、Bの3点それぞれの最終巻、つまり索引6冊を引ききれば「新聞集成を調べた」ことになったのだが、Cの索引にあたるものを国会図書館が作ったので、少し状況が変わっている。

 

○Cの記事索引――国会図書館の目次DBにあり

まず、Cの目次データが国会図書館のリサーチ・ナビ内で検索できるようになった。

・図3a NDL目次DB内で「▼追加条件を表示する」と「新聞編年史」が選べる

 

例えば「書籍館」の記事はないか検索すると(図3a)、Cの新聞編年史(昭和10年度版)に、何らかの記事が転載されていることがわかる。

・新聞集成昭和編年史 第10巻(昭和10年度版) | 明治大正昭和新聞研究会 | 1967 | 210.7-SI461

リサーチ・ナビのインターフェイスが悪いのでくじけそうになるが、タイトル青字をクリックし、画面が切り替わったら「[目次] 目次検索システム」をクリックし、「目次を見る」をさらにクリックすると、ようやく新聞集成(昭和10年度版)の目次一覧が出る(図3b)。

 

・図3b 目次からさらにブラウザの文字検索をする

 

最後の踏ん張りでブラウザの文字検索機能を使うと、「六十年前の岡山書籍館(上)知水學人4 七三四」と出るので、C新聞編年史の昭和10年版、p.734に、知水学人という人が書いた明治初年の岡山書籍館についての記事がある、とわかる。何の新聞紙に掲載された記事かは、10年版p.734を開かないとわからない。

国会図書館系のDBにしては珍しく新旧漢字の正規化がないので、両方とも検索する必要がある(例えば「謄写版」と「謄寫版」。ただし「寫版」と間違い入力だったらお手上げだ)。

また、このDBではAの元祖新聞集成のうち、明治の分の目次を検索できる(なぜか大正、昭和の分はないのが残念)。

 

○A(元祖)新聞集成のデジコレ版

A(元祖)新聞集成のデジコレ版がインターネット公開されているので、その索引巻のページを苦労してめくってお目当ての題目の巻、ページ数を引き当てれば(図4a)、家にいながらにして明治の記事を読める(図4b)。

 

・図4a 元祖新聞集成(明治分)はネットで見られる

 

・図4b 例えば「書籍館」の記事

 

 

■スクラップブック由来の新聞DBを

新聞記事文庫(神戸大学附属図書館デジタルアーカイブ)

大正期の縮刷版、昭和期の新聞集成に先行して、個人や組織が作っていたのが新聞記事のスクラップブック(貼り込み帳)だった。これの材料となる新聞記事の切り抜きを、主題限定で郵送してくれる「切り抜き通信社」なども明治からあった。国会図書館も創立の前年から(衆議院調査部が創始)1990年代まで大規模な新聞切り抜きを作成していた(現在、ほぼ死蔵されてしまっている)。戦前、神戸高等商業学校が作成していた大規模なスクラップブックをデジタル化してインターネット公開しているDBがある。経済記事が主で社会面記事はなく、時期は明治末から昭和15年頃までだが、これが意外と使えるのだ。

というのもスクラップブック由来なので記事分類が実際に使える(新聞DBは記事分類が事実上、使えない)うえに、本文がフルテキスト化されているので、微細な事項や「言い回し」なども検索できる上、切り抜き版面が画像データで見られるので、ルビを判読して固有名の読みを知ったりできるのだ。

 

・図5a 新聞記事文庫の記事分類は使える

 

・図5b 本文テキストと版面画像の両方あるのが非常に便利

 

■明治〜昭和前期の『官報』も新聞紙DBとして使える

○『官報』は昭和前期期まで新聞紙でもあった

現在、NDLのデジコレに1883(明治16)年から1952(昭和27)年までの『官報』が掲載され、目次情報を検索できる。これがネットで誰でも見られる新聞DBでもある、ということはあまり知られていない。今でこそ『官報』は法令の公布手段とみなされているが、昭和前期まで雑多な記事が載せられており、商品広告も掲載されていた。もちろん法令や公告なども載ったが、戦前の官報は社説のない新聞紙と考えてよい。

残念ながらNDLの目次採録方針は法令記事に偏り、官庁の各種広告(登記、入札)や報告などを採録していない。一方で、1919年4月から掲載され始めた民間の商品広告については、粗いながらも一応、メタデータが採られており、1939年9月分まで検索できる。(一般広告は存続しているのになぜか同年10月から非採録)。データの持ち方は、ちょうど新聞DBの過去記事と同じ構造になっている。

 

・図6a 謄写について検索

 

例えば謄写版の歴史を調べたいと、「謄写」で検索すると(図6a)、広告記事が結構ヒットする(図6b)。

・図6b 謄写版の広告

 

戦前期官報の記事ジャンルは大きく9つに分けてよいだろう。少し検索してみたところ、次のようなメタデータの採録状況であるように思われる。

 

特に③の報告や⑦の広告がきちんと検索できるようになれば、戦前官報はまさに新聞紙として機能するだろう。明治期には海外情報の通信社の役割や、新聞紙の誤報訂正も官報が行っていたのだから。

 

■まとめ

戦前も含め「新聞記事をざっと調べた」という場合、ヨミダス、聞蔵を検索し、NDL目次DBで新聞集成を検索し、新聞集成の索引6冊を引き、新聞記事文庫を検索し、NDLデジコレで官報検索をしてみる、という一連の動作を自動的にしてきた。

将来は必ずや、NDL地下書庫に眠る幾万とある原紙や明治新聞雑誌文庫の原紙が、すべて撮影、画像化され、すべてフルテキスト化されることになるだろう、そして家にいながらにして明治この方、文化史、風俗史のことが全部わかるようになるだろうが、それまではこれで我慢するしかないだろう。

もちろん、原紙やマイクロを見ていく地道な作業も尊いし、事件発生年月日から「東京五大紙」のあたりをつける探索技法などもあるが、それはまた別の話としたい。

新聞紙の物理的側面、すなわち「版」の問題、「地方版」や「面」や「欄」の歴史、柱記事の問題、版面位置による新聞社の重みづけ(「たすき掛けの法則」という)、段数による重みづけなど、新聞紙書誌学ともいうべき問題も記事の評価に関わってくるが、ほとんど研究されていないし、別の話になる。

私はヨミダス推しだが、それでもメタデータの品質論は課題として残っている。高梨章「悪い索引」『日本古書通信』71(6) p.10~11(2006.6)を参照のこと。いわんや官報記事メタデータにおいておや。

 

※新聞DBの詳細、メタデータ切り替えにつき、畏友藤元直樹氏よりご教示を得、追記した(2021.10.26)

 

■次回予告

次回はアンケートにあった<「として使う」法――例えば新聞DBを百科事典として>を取り上げます。レファ司書のベテランは、ツールがない主題の質問でもなんやかんや、調べをつけちゃうのですが、なぜかといえば、この「として使う」法を体得しているからなのです。

 

 


小林昌樹(図書館情報学研究者)

1967年東京生まれ。1992年国立国会図書館入館。2005年からレファレンス業務。2021年に退官し慶應義塾大学文学部講師。専門はレファレンス論のほか、図書館史、出版史、読書史。共著に『公共図書館の冒険』(みすず書房)ほかがある。詳しくはリサーチマップ(https://researchmap.jp/shomotsu/)を参照のこと。

 

☆本連載は皓星社メールマガジンにて配信しております。

月一回配信予定でございます。ご登録はこちらよりお申し込みください。