古のインターネットでは、PDFファイルはブラクラ扱いを受けていました。
しかし今では超便利ツールとして活躍しています。時代の変化を感じますね。
特に役所のホームページでは「とりあえずPDF化しておけば大丈夫」という感覚で、色々な情報がPDF化されて掲載されています。
PDFに限らず、どんなファイルにも「メタデータ」というものがあります。
ざっくりいうと「プロパティの中にあるデータ」であり、作成日・更新日や作成者などの情報のことを指します。
メタデータの中でも特に有名なのが、画像データのexif情報です。
弊ブログでも過去に取り上げたことがありますが、最近はきちんと公表前に削除するのが常識として定着しつつあるようで安心しています。
弊ブログでも過去に取り上げたことがありますが、最近はきちんと公表前に削除するのが常識として定着しつつあるようで安心しています。
PDFファイルを公表するということは、必然的にPDFファイルに含まれるメタデータも公表されてしまいます。
この「PDFファイルのメタデータ」が意外と厄介で、下手をすると炎上案件を引き起こしかねません。
右クリックするだけでは閲覧できない
PDFファイルのメタデータはプロパティの中に潜んでいます。
ファイルを右クリックして見られるプロパティではなく、Adobe Acrobat Reader DC(閲覧機能だけの無償版)のようなPDF閲覧ソフトの中で見られる、より詳しいほうのプロパティです。
ここには、PDF化する前の元データ(ワードやパワーポイントのファイル)のプロパティが一部残存しています。
実例を見てみます。左が元データ(ワードファイル)のプロパティ、右がPDFのプロパティです。
「タイトル」と「作成者」がそのまま残っています。
これらの情報が残っていて、役所外部に知れ渡ってしまうと、非常に面倒です。
タイトルのせいで不要なトラブルを招く
まずはタイトルから見ていきます。
メタデータにおける「タイトル」は、ファイル名とは別物です。
PDFファイルの名称をいくら変更しても、「タイトル」は変わりません。
PDF化する前の元ファイルの名称がそのまま残るようです。
伝えたい情報はファイルの中身とファイル名に記載しておけばいいのであり、メタデータに記載する必要はありません。
メタデータの「タイトル」は、「file01」のような無機質な名称か、ブランクで十分です。 メタデータの「タイトル」欄は、そこに使われている単語のニュアンスをめぐり、トラブルの引き金になりかねません。
画像で示した例でいうと、タイトルに含まれる「講演」「資料」という2語は、人によって定義が異なる可能性が高い単語です。
各人がバラバラな定義を持っているせいで、以下のような抗議が想定されます。
- 「講演」は目上の人間が目下の人間に対して行うものだ、公僕である役所職員が「講演」するなんて思い上がりも甚だしい、謝罪しろ
- 「資料」と称するからには講演内容の出典や根拠資料を網羅的に示すべきだ、学会ではこれが常識だ
- 「講演資料」と題するなら講演そのものを追体験できるデータ、つまり音声と動画を掲載すべきだ、テキストだけで済ませるのは怠慢だ
まさにメタデータが余計な一言になって、住民感情を逆撫でしてしまうのです。
さらに、資料の中身とは直接関係のない情報がタイトルに書かれていると、あらぬ疑念をかきたててしまいます。
画像で示した例でいうと、「案B」「修正4」の部分が問題です。
これらの情報は講演内容そのものとは関係ない「講演に至るまでの検討過程」であり、本来は役所外部に披露する必要のない情報、これも余計な一言です。
「案B」「修正4」という文言を見ても、大抵の人は関心を示さないでしょう。
しかし、役所と戦いたい人にとっては、この情報が攻めの糸口になります。
- 案Aはどんなものだったのか?なぜ案Bにしたのか?もしや案CやDもあるのか?
- どうして修正が生じたのか?そもそも4回も修正する必要があったのか?修正に要したコストは?コストに見合う成果はあるのか?
こういう攻撃を誘発してしまうのです。
個人情報漏洩になりかねない「作成者」情報
「作成者」情報のほうがより深刻です。
個人情報の漏洩というマジモノの不祥事に直結するからです。
公文書公開のルール(情報公開法・自治体の情報公開条例)では、公文書に含まれる個人の氏名は非公開情報であり、黒塗りしなければいけません。
誤って公開してしまうと、個人情報の漏洩になります。
※ただし個人の氏名であっても「公務員の氏名」は例外で、黒塗りは不要です。
データの場合も同様に、個人の氏名は公開してはいけません。
データの場合はさらに注意が必要です。
ファイルの中身(本文)だけではなく、プロパティ内にも情報(メタデータ)が潜んでいるからです。
メタデータの中に個人情報がある場合も、消去するなり記号に置き換えるなりして個人情報を守らなければいけません。
画像の例でいうと、「作成者=久川凪」という情報は、まさにメタデータの中の個人情報です。
原則、公開してはいけません。
(ただし、久川凪さんが公務員であれば全く問題ありません。)
役所が自前で作った資料であれば、「作成者」欄は作成した職員=公務員の名前になるので、問題は生じないでしょう。
しかし、外注して作成した資料だと、外注先の社員さんの氏名がそのまま残っているケースがよくあります。チラシとかパース図とか図面とか……
バレたら即、不祥事です。
元データのプロパティを消す
不祥事ハンター達はメタデータをよく見ています。
そもそもこの記事自体、ネット上でアンチ役所活動を展開している方の発言から着想を得ました。
その方いわく、「いつどこが不祥事を起こすかわからないんだから、日々あらゆる行政機関のサイトを巡回してメタデータに個人情報が残っているファイルを収集している」とのこと。
その方いわく、「いつどこが不祥事を起こすかわからないんだから、日々あらゆる行政機関のサイトを巡回してメタデータに個人情報が残っているファイルを収集している」とのこと。
どういうふうに悪用されるかわからないし、役所としては(今のところ)公開する義務もないので、可能な限り消しておくのが無難です。
しかし困ったことに、PDFのプロパティ内のデータは、一旦PDF化してしまうと削除できないようです。
Adobe Acrobat(PDFの加工ができる有償版)があれば消せるようですが、無償版のAdobe Acrobat Reader DCでは対応していません。
Adobe Acrobatは高価なため、役所で保有しているところはごく少数でしょう。
そのため、PDFファイルを作成する前に、元ファイルのメタデータを消すしかありません。
赤丸で囲んだところをクリックしてプロパティを消してからPDF化すれば、PDFのプロパティも綺麗になります。
できれば作成日とか更新日も消したいところなのですが、こちらは消せないようです。
コメント