ログ統合
なんかデバッグにけっこう手間取ったのだが、やっとウィキペディア日本語版のログ分離された項目を現行項目と統合して解析できた。 つまりこないだ公開した紀要の「5.3 ログ落ち項目の対応について」はすでに解決済みということ。 ダンプは20100217のもの。
- ONE PIECEの登場人物一覧 6553件
- 仮面ライダー電王 5509件
- クイズ!ヘキサゴンII 5066件
- 銀魂の登場人物一覧 4919件
- 仮面ライダーディケイド 4719件
- 銀魂 4491件
- BLEACH 4410件
- ONE PIECE 4315件
- コードギアス 反逆のルルーシュ 4111件
- 舞-乙HiME 4049件
上位10位まですべてアニメマンガバラエティ系ですどうもありがとうございました。 「ONE PIECE」圧倒的に強い。 「ほげほげの登場人物一覧」のほうが「ほげほげ」そのものよりも編集回数が多い、 という現象をどう説明すれば良いのか。
- 日本 643人
- 大韓民国 419人
- 日本の漫画家一覧 406人
- 麻生太郎 403人
- フジテレビジョン 402人
- 涼宮ハルヒシリーズ 381人
- 織田信長 373人
- 2ちゃんねる 372人
- トヨタ自動車 371人
- 第二次世界大戦 358人
登録ユーザはどちらかと言えばメインカルチャーに属する項目を編集したがる。 これも以前からわかっていたこと。 おそらく登録ユーザだからというよりは、編集「回数」ではなく編集「人数」で順位付けしたからだろう。 登録ユーザは個体識別ができるからこういう統計もできる(もちろん一人で複数のユーザ登録をしてたりボットユーザなどもいるわけだが)。 あれほど編集回数が多い「ONE PIECE」も全然上位には出てこない。 つまり、ごく一部のユーザが頻繁に細かく何度も編集している、ということがわかる。 「日本」「大韓民国」などは多くのユーザが少しずつ編集しているわけだ。 こちらは、編集に関与したユーザの総数の順であってそれぞれのユーザが何度編集したかは反映されてない。
実は、編集「回数」ではなく編集「人数」で順位付けした統計結果というのは、 うち以外ではほとんど見かけない、たぶん無い、と思う。 日本語版のログを統合したものもなおさら無いはず。
編集速度。 比較的最近流行っている項目が抽出される傾向があるが、 編集回数があまりにも多いと古いものでも上位に来ることがある。
- 仮面ライダーディケイド 347件/月
- ハイチ地震 (2010年) 244件/月
- 仮面ライダー×仮面ライダー W&ディケイド MOVIE大戦2010 235件/月
- 仮面ライダーW 210件/月
- イナズマイレブンの登場人物 173件/月
- 天装戦隊ゴセイジャー 163件/月
- 2009年新型インフルエンザの世界的流行 160件/月
- 侍戦隊シンケンジャー 153件/月
- 鳩山由紀夫内閣 146件/月
- 仮面ライダー電王 142件/月