先週、「ファイル交換ソフト利用者が急増」というニュースが流れた。
これには疑問の声が挙がっていたが、昨日、ネットエージェントからWinnyノード数は減少しているという発表があり、報道された。
私も減少しているという認識を持っていた。昨年8月末から自宅の空きPCで観測を始めていたWinny稼動ノード数調査は、その後も続けていたのでときどき数字は見ていた。前回は1年前の12月21日の日記でグラフを示した。
それと同じ方法で集計したその後のデータのグラフを以下の図1に示す。
昨年の11月末から12月末にかけての大きな減少が見られるが、これは、違法な送信可能化をしている利用者にISP経由で警告通知を行う活動が開始された時期と一致している(「ACCSがプロバイダを介してWinnyユーザに警告メールを送付」参照)。その後、年明けにぶり返し、1月末までは増加傾向が見られる。しかし、3月の頭から再び減少に転じ、ゴールデンウィーク中に若干ぶり返しつつも、その後は単調な減少傾向が見られる。3月頭に何かあったのかは不明だが、ニコニコ動画が「β」を終了し「γ」として新規ID登録を開始してサービス再開したのが3月6日だったようだ。(参考:INTERNET Watchの3月6日の記事、Alexaのページビュー履歴におけるニコニコ動画のグラフ)。
ところで、この観測データの信頼性について検討しておかなければならない。
まず、絶対値について。私の観測値はいつもネットエージェントが発表している値より小さくなっている。今回のネットエージェントの発表では、24日に35万ノードだったとされているのに対し、図1のグラフでは27万ノードくらいになっている。観測開始当初の値も、ネットエージェントの値が40万ノードに対して、私の観測は35万ノードくらいとなっている(2006年12月11日の日記参照)。この原因はまだはっきりしないが、観測方法と集計方法についての相違が原因となっている可能性の他に、調査プログラムの性能が測定制度に影響を及ぼしている可能性がある。
私のプログラムは、Javaによる記述で、スレッド数1300、Windows XP SP2 + Biot無制限設定で動作しており、1秒間に平均57接続を試みる性能になっているのだが、スレッド数を少なくすることでこの接続性能をわざと少なくして同じ測定を行ってみたところ、観測されるノード数は少なくなった。このことから、何らかの方法で性能をさらに上げることができれば、観測されるノード数が増える可能性がある。ちなみに、今回の日本レコード協会らの調査では、「9月28日17時から9月29日17時までの24時間」で「26万4,000ノード」とのことだったが、この値は図1のグラフと概ね一致している。
ちなみに、そもそも「稼動ノード数」を完全に実測するのは不可能である。なぜなら、これら「ノード数」の定義は、24時間以内に一度でもWinnyネットワークに参加したノードの数であるから、「5分間だけ使った」というようなユーザを観測するには、5分でネットワークを一巡するくらいの性能が必要で、それはなかなか難しい(私のプログラムでは約1時間半で一巡する)。したがって、性能を変えながら測定して、究極的性能時の値を推定するという方法が考えられる。これについては既にデータはとってあるので、いずれまとめたい。
次に、相対値について。上に述べたように、観測プログラムの性能が観測ノード数に影響してしまうことから、例えば、インターネットのネットワーク自体の性能が低下することが、観測ノード数に影響してしまう可能性が否定できない。つまり、図1のグラフで減少傾向が見られる原因が、実はユーザが減っているのではなくて、インターネットがつながりにくくなっているためだという可能性がなくもない。ただ、上で「1秒間に平均57接続を試みる性能」と示した性能値で見ると、調査開始から現在までほとんど変化していない(図2)ことから、そのような影響はないのではないかと考えることもできる。
ちなみに、逆に、実際のノード数が減少すると、それに比例して一巡するのに要する時間が短くなるため、見落とすノード数の割合が減少して測定精度がいくらか向上することになるはずであるから、実際のノード数が減少しているときには、観測されるノード数の減少率は実際よりも緩くなってしまっている可能性もある。つまり、実際には図1より激しく減少している可能性がある。ただ、その影響がどの程度表れるかはまだ計算していない。
さて、日本レコード協会らが「利用者が急増」と発表したことに対して、疑問の声が挙がっているわけだが、このアンケート調査における「利用者数」の定義に注意が必要である。
日本レコード協会らの調査が言う「現在利用者」とは、過去1年間で使用したことのある経験者数である。したがって、「24時間の稼動ノード数」が単調に減少しているにもかかわらず、「過去1年間で使用したことのある経験者数」が「急増する」ということは、同時に起こり得る。たとえば、次などの場合にそのような結果となる可能性がある。
調査の目的において「使用経験者数」の増加が重要であるなら、そのような調査結果も有意義であろう。ただ、それならば、1年間に新たに使い始めた人の増減を調査する方がよいだろう。
また、日本レコード協会らの調査結果は、現状を示すものとしては情報が1年くらい遅れたものになっていることにも注意が必要だ。
つまり、今回発表された調査は 9月に実施されたもので、「現在利用者」とは2006年9月からの約1年間での経験者数であるし、比較対象となっている前年の調査は2005年7月からの約1年間での経験者数であることから、もし、2006年9月ごろがWinny稼動ノード数のピークであったとすれば、この1年4か月の減少傾向は、日本レコード協会らの調査にまだ反映されていない可能性がある。
最近の情勢変化を調べるのが目的であるなら、「現在利用者」は、「過去1年間に」ではなく「過去1か月に」くらいの短い期間での利用経験を問うアンケート内容とした方がよいだろう。もちろんそれだけでは足りないので、「過去1か月の間に使用した」「過去3か月の間に使用した」「過去6か月の間に使用した」「過去1年の間に使用した」「過去2年の間に使用した」「過去4年の間に使用した」「過去8年の間に使用した」のそれぞれを問うようにすれば、全体像の把握が可能なデータが得られるだろう。この調査は今からでも可能である。
別の視点からの分析が以下にあった。2005年以前の同調査との比較が検討されていて、興味深い。
「現在利用者」の定義の変更(徐々に定義が拡大)。
- 2002年の調査では特に説明なし。
- 2003年と2004年の調査では、ファイル交換ソフトを利用していると回答した利用者と定義。
- 2005年の調査では、アンケート時より半年以内にファイル交換ソフトを利用したことがあると回答した利用者と定義。
- 2006年と2007年の調査では、アンケート時より約1年以内にファイル交換ソフトを利用したことがあると回答した利用者と定義。
これはひどい……。
上の「ファイル交換ソフトの利用者は急増しているのか?」引用部で、リンク先の元記事で表現が一部修正されたのに合わせ、引用部も修正した。
*1 極端に小さな値が記録されている部分は、マシントラブルで測定が中断したときの再起動時の中途半端な値が記録されたもの。
昨日のエントリ「ダウンロード違法化・初音ミク着メロ騒動・クリスマスと賛美歌 」でちょっと触れたACCSなどによるファイル交換ソフト利用に関する調査について追記。CNETにも ファイル交換ソフト:利用者、3.5%から9.6%に急増--著作権侵害も激増 (CNET) なんて載っ