先月こういう話題があった。
子宮頸がんワクチン調査 名古屋市が結果を事実上撤回 #nhk_news https://t.co/cokWXHnenS
— NHKニュース (@nhk_news) 2016年6月26日
子宮頸がん「全国で初めて大規模調査を行った名古屋市が、ワクチンを接種したグループとしなかったグループとの間に症状の差は無かったとする分析結果を事実上撤回し、今後、データの分析はしない方針であることが分かりました」(えっ!) https://t.co/okXV3KF6O8
— Haruhiko Okumura (@h_okumura) 2016年6月26日
正しくは「速報と変わらず因果関係なし」 名古屋市子宮頸がんワクチン副反応疫学調査 https://t.co/O1EMviwMbQ :「撤回」という言葉からは、名古屋市が「因果関係なし」という結論を翻したかのようなイメージを与えるが、全くそうで…
— ウェッジ編集部 (@WEDGE_Infinity) 2016年6月27日
現在、有志の方々が担当課に生データを公開して、と。分析を撤回とはどうしたことかと、意見を送ったり電凸されたりのようですが、そうした事態を避けるために今の形を選択し、裏目に出てしまった感。「改竄を防ぐためpdfのみ」は、役所のデフォ…。https://t.co/x36QmH4UBB
— Takashi Okumura (@tweeting_drtaka) 2016年6月27日
役所の人たちは、「PDFで出せば改竄を防げる」と信じているので、それを責めても始まらないです。なぜ、そう考えているのか。どうしたら、そうした事態を変えられるのかを、有識者の方々に考えて欲しいです。(そして、僕を助けて欲しい)https://t.co/vVsxAtMRdV
— Takashi Okumura (@tweeting_drtaka) 2016年6月27日
@parasite2006さんの「名古屋市の子宮頸癌ワクチンアンケート調査データの解析に挑む」が10000viewを達成。すごい人気のまとめをお知らせします。 https://t.co/ATqztgec4V
— まとめのお知らせ (@togetter_pr) 2016年7月8日
名古屋市がcsvファイルの類を出さないのはひどいね。クソだと思った。貴重な頭脳の無駄遣い。>名古屋市の子宮頸癌ワクチンアンケート調査データの解析に挑む - Togetterまとめ https://t.co/FdHMLVxgJm @togetter_jpより
— 黒木玄 Gen Kuroki (@genkuroki) 2016年7月4日
これはすごい成果だ。ネット科学検証はんぱない/ 名古屋市の子宮頸癌ワクチンアンケート調査データの解析に挑む - Togetterまとめ https://t.co/uPeCarqqhJ
— Naoki Asakawa / 浅川直輝 (@nasakawa) 2016年7月6日
名古屋市のデータ いくら匿名化してあったとしても調査回答データという生データをこんなにずらっと並べていて良いのかなぁ https://t.co/8elMbaxopg 全然気にしてなさそうな医師や統計学者の呟きを見るたびに懸念が深まる。高木浩光先生なんかはどう考えるのだろ?
— 春田晴郎 (@HarutaSeiro) 2016年6月29日
そのデータは名古屋市の保健医療課が以下で公開していた。
なるほど、自由記載の回答項目まで公表されていると。それはひとまず置いておくとして、「調査回答データ」は、Excelから印刷出力しただけのPDFのようだ。
これを有志でCSVファイルに変換したものが、奥村先生のところに掲載されている。
ここにある「kaito.csv」を用いて、名古屋市が一般公開したデータがはたして匿名加工情報(非識別加工情報とも言われるが)に該当し得る内容なのか*1、検証してみた。
まず、同じ行が何件ずつあるかを集計して、多い順に並べて、上位を抽出してみた。
sed 's/^[^,]*,//' kaito.csv | sort | uniq -c | sort -nr | head
で処理してみると、以下の結果となり、最大グループは47件、その次に29件、28件、20件……と続くものとなった。
47 0,0,1,0,0,0,0,0,0,1,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,NA,0,0000,0,0,0,0,0,NA,0,0000,0,0,0,0,0,0,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,1,0000,0,0000,0,0000,0,1,0000,0,0000,0,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,0,NA,1,0000,0,1,0000,0,0,0,0,0,0 29 0,0,1,0,0,0,0,0,0,1,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,NA,1,0000,0,0,0,0,0,NA,1,0000,0,0,0,0,0,0,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,1,0000,0,0000,0,0000,0,1,0000,0,0000,0,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,0,NA,1,0000,0,1,0000,0,0,0,0,0,0 28 0,0,1,0,0,0,0,0,0,1,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,NA,0,0000,0,0,0,0,0,NA,0,0000,0,0,0,0,0,0,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,1,0000,0,0000,0,0000,0,1,0000,0,0000,0,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,0,NA,0,0000,0,0,0000,0,0,0,0,0,0 20 0,1,0,0,0,0,0,0,0,1,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,NA,0,0000,0,0,0,0,0,NA,0,0000,0,0,0,0,0,0,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,1,0000,0,0000,0,0000,0,1,0000,0,0000,0,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,0,NA,1,0000,0,1,0000,0,0,0,0,0,0 19 0,0,1,0,0,0,0,0,0,1,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,NA,0,0000,0,0,0,0,0,NA,0,0000,0,0,0,0,0,0,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,1,0000,0,0000,0,0000,0,1,0000,0,0000,0,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,2,0000,0,1,NA,1,0000,0,1,0000,0,0,0,0,0,0 15 0,0,1,0,0,0,0,1,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,NA,0,0000,0,0,0,0,0,NA,0,0000,0,0,0,0,0,0,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,1,0000,0,0000,0,0000,0,1,0000,0,0000,0,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,0,NA,1,0000,0,1,0000,0,0,0,0,0,0 13 1,0,0,0,0,0,0,0,0,1,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,NA,1,0000,0,0,0,0,0,NA,1,0000,0,0,0,0,0,0,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,1,0000,0,0000,0,0000,0,1,0000,0,0000,0,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,0,NA,1,0000,0,1,0000,0,0,0,0,0,0 13 0,1,0,0,0,0,0,0,0,1,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,NA,1,0000,0,0,0,0,0,NA,1,0000,0,0,0,0,0,0,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,1,0000,0,0000,0,0000,0,1,0000,0,0000,0,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,0,NA,1,0000,0,1,0000,0,0,0,0,0,0 13 0,0,1,0,0,0,0,0,1,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,NA,1,0000,0,0,0,0,0,NA,1,0000,0,0,0,0,0,0,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,1,0000,0,0000,0,0000,0,1,0000,0,0000,0,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,0,NA,1,0000,0,1,0000,0,0,0,0,0,0 13 0,0,1,0,0,0,0,0,0,1,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,1,0000,0,0,0,0,0,NA,1,0000,0,0,0,0,0,NA,1,0000,0,0,0,0,0,0,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,0,0,0,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,0,00,NA,1,0000,0,0000,0,0000,0,1,0000,0,0000,0,0000,0,1,0000,0,1,0000,0,1,0000,0,1,0000,0,2,0000,0,1,NA,1,0000,0,1,0000,0,0,0,0,0,0
続いて、1行しか存在しない(つまりユニークな)回答が存在するか、何件存在するかを、以下のようにして数えたところ、29,836件あった。
% sed 's/^[^,]*,//' kaito.csv | sort | uniq -c | grep "^ *1 " | wc -l 29836
全数が30,793件なので、96.9%がユニークな回答だということになる。
これでは匿名加工情報(非識別加工情報)に該当し得ないデータであろう。
まあ、そうなることは、設問項目の多さからすれば、確かめてみるまでもなく明らかである。
では、このようなユニークデータの大量公開が、回答者の一部についてプライバシー侵害をもたらし得るものかというと、なかなか簡単には判断がつかない。ぱっと見では問題ないようにも思えるが、個別の事情まで見ないと本当のところはよくわからないのではないか。
まあ、そこは置いておくとしよう。問題は、このように公表されることが、調査時に調査対象者(回答者)らに説明されていたか、回答者らはそれを認識あるいは予見できていたかである。
その点、名古屋市は、次のように、調査票において「ご回答いただいた内容は統計的な処理にのみ用いられます。」と約束していたのである。
これは回答者に対する重大な裏切りではないかと考え、問い合わせ先として書かれていた、保健医療課感染症係に電話で尋ねてみたところ、次のようなやりとりとなった。
私:「ご回答いただいた内容は統計的な処理にのみ用いられます。」と書いてあるのに、統計的な処理なんですか?
係:生データの公表がということですよね。そうですね、えーと、ちょっとお待ちいただけます?
(2分待ち)
係:お待たせしております。えーと、一応その、うーん、まあ、あの、特にそのデータがですね、何かしらその改変とかされないような形で集計のみに使えるような形でうちとしても出させてもらってるっていうのが一つと、あとーその、調査している段階でですね、生データの方は公表いたします、皆様の方で集計等やっていただく、また、解析等をっていうようなお話もさせてもらってましてー、ええ、であのー、今回出したことについても、なので、そういった観点からですね、とくにあのー、違反をしているわけでもないといような回答なんですけども。
私:今、質問に関係ないことをたくさんおっしゃいましたね。例えば、改ざんできないようにしているとか、
係:あはい。
私:別にそういうことは聞いてないんですよ。
係:はいはい。
私:そういった問い合わせがいっぱいあることは知ってますよ。CSVで出せとか言ってる人達がいますからね。PDFで出すなんてトンデモないとか。言われてますけど、
係:ええ、ええ。
私:そんなことは聞いてないんですよ。私が聞いていることは、調査票には「統計的な処理にのみ用いる」と書いてあるのですから、回答した人は自分の記入したことがそのまま公表されることはないという意味だと思って、いろいろ書いていると思うんですよね。
係:はい。
私:ということだけを聞いているんですよ。そのことについてだけ回答してください。
係:あ、そういうことですね。であればですね、うちとしましては、えーっとー、なので、えー、違反しているというふうには、えー
私:理由を、聞いているんです。
係:あ、はい。理由ですね。個人を特定されるような内容等は特に出してない。で、えー、ま、そのー……。そうですね。なので、……。えーと……。ちょっとお待ちいただけますか。
(2分待ち)
係:何度もお待たせしてもうしわけないです。
私:はい。
係:っとー、集計の、集計につながるデータですね、なんで、集計……。うん、集計につながるデータ、まあ、集計に用いたデータしか出してない。なんでまあその、中身の個人につながるようなデータとかは出してないのでー、あくまで集計上で使ったデータしか出してないということです。
私:いやいや、集計して……。じゃもう一回お尋ねしますが、この調査票の「ご回答いただいた内容は統計的な処理にのみ用いられます。」というのは、
係:はい。
私:どういう意味なんですか?
係:あ、なので、うちのあのー、回答結果報告書の方に用いた集計にのみ使ったデータていうことです。
私:最初に出して消したやつのことをおっしゃってるんですね?
係:最初に出したやつというのは?
私:え?
係:今ホームページに載っている結果報告書のデータです。
私:例えばこの、「のみに用いられます」と書いてあるということは、
係:はい。
私:「こういうふうには用いない」という意味の裏返しで書かれていると思うんですけど、
係:はい。
私:どういうことはしないという意味で、この文章はあるんでしょうか?
係:あのーなので、調査票、ご回答いただいた調査票の、そのままのデータで出すことはないということです。
私:そのままのデータが公表されたんではないんですか?今回。
係:そのままのデータではなくてですね、まああの、数字とかその点、まあ数字というか番号で選ぶようなところはそのままかもしれませんが、その他の個人につながるようなデータについてはこちらの方であのー、消させていただいています。
私:個人に関するデータというのは、何のことでしょうか?
係:えっとー、なので、個人につながるような、特定されるようなデータですね。
私:どこにあるんですか? あったんですか?
係:えー、記載欄とかですね。自由記載欄とかですね。その他あのー、ま、言葉で書くようなところですね。
私:そこに名前とかがあったら消してますと、いうことをおっしゃっている?
係:はい。
私:そこはそのまま出したりはしないと。
係:してないです。
私:じゃその、名前を消したりする部分というのは、「統計的な処理」とおっしゃるんですか?
係:統計的な処理……。……。名前を消したりするのは統計的な処理……。ですか?
私:ええ。今どういう質問をしたかというと、
係:はい。
私:統計的な処理のみに用いると書いてあるから、
係:はい。
私:それ以外のことはしないと書いてあるという意味であって、
係:ええ。
私:それ以外っていうのはどういうことが考えられるかとうかがったらば、
係:はい。
私:自由記入欄について名前などが入っていたら消して処理すると、消さずに出すことはしないと、そういう意味だとおっしゃいましたけども、
係:ええ。
私:ということは、名前を消したりすることっていうのは、「統計的な処理」と名古屋市では言っていると、こういうことになりますね?
係:統計的な処理……。えー……。ええ、ええ、はい。
私:名前を消すっていう作業は「統計的な処理」なんですか?
係:ではないですね。
私:ほう。そうすると違反してませんか?
係:……。あの、集計上のデータだと思ってますのでー。あのー、違反しているとは思ってはいないんですが。
私:だって、今のロジックわかりました?名前を消すっていう作業は統計的な処理ではないんですね?
係:はい。
私:そうすると、「統計的な処理のみに用いる」というのに違反していますよね? 統計的な処理をせず、名前を隠しただけで生データを出しちゃった、っていうのは統計的な処理に当たらないんではないですか?
係:ふん、ふん……。はあ、そういうことですね。はははあ。あーと、そうですね、えーと、うーん、ちょっとお待ちください。
(2分待ち)
係:何度も申し訳ないです。えーと、やっぱりですね、先ほど、データですね、については、えー特に違反していないというような、あの、ごめんなさい、
私:そうおっしゃるのは勝手ですが、理由を尋ねてますからね。違反してないんです違反してないんですと言ったところで、何の説明にもなっていないですから、お願いします。
係:なので、えーと、集計に用いたデータですね、回答データにつきましては、基本的には調査票からそのまま持ってくるのではなくですね、どの方が回答したかっていうのをですね、順番等も全然違いますので、そういうところもわからないような形にした形で、ま、集計に用いたデータとして出していると、いうことで、えーと、違反してないと、うちとしては考えております。
私:えーと、順番を入れ替えたと。
係:順番を入れ替えたというか、来たものについてやってますので。
私:え?
係:あの、回答をいただいたものについてやってますので、誰がどのデータっていうのも全くわからないです。
私:元々、無記名アンケートですよね?
係:そうですね。
私:だからそこはべつに問題にしてないんですよ。個人情報がどうこうとか、個人情報保護条例がどうとか、そういうことはべつに言ってなくてですね、
係:はい。
私:単にその、調査票に書いてある約束を、破ったのではないか?ということだけを言ってるんですけどね?
係:それについては、集計に用いたデータですので、
私:集計に用いたデータっていうのは、統計処理の前のデータじゃないんですか?
係:……。いや、あのー、結局そのまま……、あの、調査票のものをまた集計かけてますので。集めたものですけども。
私:集計っていうのは、並べ替えただけで集計とは言わないと思うんですけども?
係:はい。まそうですね、計算等をしたものですね。
私:うん?
係:ま、えーそうですね……。うん、そうですね、集計、集めただけではそう言わない。
私:名古屋市ではあれですか? 紙で出た調査票を、1個にまとめてExcelにしたらそれで集計って言うんですか? データが元データと一対一対応しているものでも
係:ごめんなさい、それはちょっと違いますね。
私:一人ひとりのデータ全部出しているのに、集計って言うんですか?
係:それは違います。
私:はい。じゃどういうことですか。よくお考えください。
係:なので、えーと、ま、ごめんなさい、えー……。集計、ごめんなさい、さきほどから何度も同じことを言って申し訳ないですけど、ま、集計に用いたデータである。で、えっとま、そのー、集計結果の一部として出してます、報告書の一部として出してますので、あの、で、そのー、違反じゃないかと言われるんですけども、そこについてはですね、ま、集計上で必要なデータということで、とくに違反と思ってはいない、というのがうちの考えですのでー
私:まあ何度も同じことをおっしゃるならこちらも何度も同じことを伺いますけど、
係:ええ。
私:「のみ」って書いてるじゃないですか。
係:ええ。
私:「のみ」ってことは、こういうことはしないって約束をした文章だと思うんですけど、どういうことはしないっていう意味なんですか?この「統計的な処理のみに用いられます。」というのは、何をしないという意味で書いたのかというのをお尋ねしたい。
係:……。
私:安心して記入していただくために書いている約束ですよね?
係:ええ。……。そうですね。なのでえーっとまあその、書いたことで個人が特定されたりとかですね、そういったことの心配がないように、統計処理のみっていうふうな書き方をしてあると。
私:それで、統計処理なんですか?この生データが。
係:……。ま、統計処理、の一部ですね、はい。
私:統計処理の、元データだから、統計処理だって、おっしゃってるんですか?
係:ま、そうですね、はい。
私:統計的な処理のみに用いるっていうのは、統計的な処理をした結果のみ公表するっていう意味だと普通とるんではないんですか?
係:ま、ごめんなさい、一部と考えています。
私:統計処理した結果のみ公表するというふうに普通の人は受け取るんじゃないんですか?なのに、名古屋市としては、そんなはずはないと。統計処理の過程であれば、元々の全データを公表することも「統計的な処理のみに用いる」という意味になると、こうおっしゃるんですね?
係:まあ、そうです。
私:今後もそういうふうに調査をされていくんですか?
係:今後もとおっしゃいますと?
私:名古屋市として統一的な調査時の考え方なんですか? これから名古屋市の調査に答える人は、「統計的な処理のみに用いられます」と書いてあっても、生データが公表されると思わないといけないわけですね?
係:いや、ま、そういうわけではないと思います。
私:どういうわけなんですか?
係:まあその、ま、
私:そういうことは本来許されないけど、今回はやっちゃいました、でも問題ありませんと、そういうことをおっしゃってるんですか?
係:いえ、そういうわけじゃないです。
私:じゃあどういうことですか?
係:まあなんであのー、公表の仕方だと思うんですが、今回の報告書としましては、そちらの方を統計上の一部として出させてもらっているという、そういう考えです。
私:今後も同じようにされるということですね?
係:……。
私:名古屋市の調査はすべてそうであると。
係:まあ、そのときのその公表の判断だと思いますけども。調査としてそれが統計の一部として出すっていう判断が下れば出すんじゃないかと思いますが。
私:統計の一部っていう点についてじゃあお尋ねしますが、
係:ええ。
私:調査票のチェックで書き込んでいく、はい・いいえと、チェックがどんな具合だったかは見えなくなってますけど、つまり、乱暴なチェックなのか、丁寧なチェックなのかとか、見えなくなりましたけど、データとしては全く失われてないですよね? 回答が何であったかということについては。たとえば、一部の人を削除したとかいうことはないわけですね?
係:そうですね。
私:それって、統計処理なんですか?
係:……。
私:統計的な処理なんですか?
係:統計的な処理……?
私:データは何も加工してないんですよね、元データのまま。
係:まあ、なので、個人につながるところは消させてもらってます。
私:そこの話はしてないんですよ。選択肢で回答する部分のことについて伺っているんです。統計的な処理してないんじゃないですか?
係:なんでえーと、そのー、今回出した報告書の統計のデータの中の一部です。
私:え? 「のみ」って書いてあるじゃないですか。
係:調査票の方ですよね?
私:ええ。この「のみ」ってどういう意味ですか?
係:なのでそのー、個人につながるような、まそういった心配がないようなふうにしますよ、という意味。
私:生データは出すということですね? このチェックで回答したものは。
係:は、出てます。はい。
私:名古屋市としては、統計的な処理というのは生データを出すと、そういうことなんですか?とさっきからお尋ねしているんですけど。
係:なのでごめんなさい、今回の調査につきましては、えーと、それも統計の一部として出させてもらってます。
私:統計の一部。統計化する前なのに統計の一部だと。
係:統計のデータの一部ですね。
私:統計化の結果とは書いてないと言いたいわけですか?「統計的な処理のみに用いる」っていうのはべつに「統計の結果だけ公表します」とは言ってないと、元データも公表することも含まれると。
係:まあ、そうですね、はい。
私:はっ。ちょと最初にいただいたご回答に気になる点があったので、確認したいんですが、調査票にはそう書いてあるけども、実際にお尋ねする際には公表するって説明したっていうようなことをチラっとおっしゃいましたけど、
係:ええ。
私:その部分について本当なのかを確認したいんですが。
係:うん、あのー……。そうですね、速報時にも、えー説明はしてあります。
私:誰に説明したんですか?
係:誰に?
私:速報時に説明したというのは誰に説明したと? 記入した人にですか?
係:あー、記入した人、いや、えーと、記入した人、一人ひとりにはしてないです。
私:記入した人には何も説明していないということでいいんですね?
係:何も……、うん、直接はしてないです。
私:調査票に書いてある約束のみしか説明してないということですよね?
係:届いた人にはそうですね。
私:届いた?
係:調査票を受け取った方にはそうですね。
私:じゃあ、冒頭でなんかおっしゃったことは言い間違いということでいいですかね?
係:言い間違いというと?
私:調査票にはそう書いてあるけどもちゃんと説明していたと、
係:ああ、その方々に対してですか。
私:ええ。
係:ええとー、そうなりますね。
私:そうなるというのは?
係:……。
私:そうなりますねというのはどういう意味ですか?
係:えーとなんでその個々一人ひとりに対してということですね。
私:対して何ですか?
係:えーなんで、直接、その、えー、生データの公表をいたしますというような説明はしていないです。
私:ああ、わかりました。ありがとうございました。
係:はい。
ということで、名古屋市のアンケート調査に答える方は注意されたい。
*1 もっとも、このアンケート調査は無記名方式であるので、元データからして、日本の個人情報保護法では(名古屋市個人情報保護条例でも)「個人情報」に該当しない(とはいえ、日本法でも「個人に関する情報」ではあるし、EU法ではpersonal dataに該当するものと考えられるが。)のであるから、改正個人情報保護法の「匿名加工情報」には該当し得ない(匿名加工情報はその定義上「個人情報を加工して得られる個人に関する情報」に限られるので)から、このような問いはそもそもナンセンスなのだが、あえて、仮に元データが記名式で個人情報であったとした場合に、この公表データが匿名加工情報に該当し得る内容かという意味。