まだやってる。enwiki pages-meta-history.xmlのダンプ


# 2009-12-03 12:53:43 in-progress All pages with complete page edit history (.bz2)
2009-12-18 18:33:10: enwiki 2108688 pages (1.602/sec), 147306000 revs (111.904/sec), 97.7% prefetched, ETA 2010-01-06 14:40:46 [max 329446505]
* These dumps can be *very* large, uncompressing up to 20 times the archive download size. Suitable for archival and statistical use, most mirror sites won't want or need this.
* pages-meta-history.xml.bz2 139.5 GB (written) 


enwiki-20080103-pages-meta-history.xml.bz2 は 133.0GB「しか」なかったようなので、 そのときよりはもうすでに多くダンプ終了してます。 が、20080103から20091203まで、1年11ヶ月経ってますから、 どんだけコンテンツ増えてるか想像つかないね。

ダンプはだいたい3週間に一回行われるらしいのだが、そのタイムリミットは刻々と近づいている。 bz2が終わっても7zがまだ残っている。 このままだとダンプの周期を長くしないかぎりenwikiのダンプは不可能、 或いはスーパーコンピュータでも導入して超高速ダンプするか。 いやはや。