2010-01-01から1ヶ月間の記事一覧

越後長岡藩の家臣団

仕事を一つすっぽかした。 それはそうとやっとjawiki-100116の解析が終わった。 2週間以内で一番編集されていたのは、なぜか 越後長岡藩の家臣団。 1ヶ月以内で一番はウィンドサーフィンだった。 ノート:ウィンドサーフィンが熱い。 編集速度が速い順では ハ…

Hash clear

だいぶ速くなってきたような気がするが、それでもまだ遅いのでいろいろいじる。 OptimizingRubyProgramによれば Hash は new するより clear する方が速いらしいので、そうしてみる。 Array は new するより clear するより replace([]) する方が速いらしい…

またあらし

学科の mediawiki にまた「論文を買え」(笑)というサイトの嵐が来た。 前回と今回のパターンから察するに、適当だが実在する人物の名前でユーザ登録して、 自分のサイトへのリンクを張る、というもの。 あと、chaptcha がうまく働かずリンクを張れてしまうケ…

mac os x server

学科のシステムリプレイスで dns や opendirectory などが全部 mac os x server で管理されるようになったので、 勉強してみる。 ていうか、network のトラフィックの監視やらなにやらもみなこれでやらんといかんので、 やむを得ない。 業者に root のパスワ…

George W. Bush その2

enwiki-20080103-pages-meta-history.xml.7z から George W. Bush の記事だけ抜き出したら プレインテキスト非圧縮で 3GB もあってわろた。 想像以上のでかさ。 こうなるともう普通のやり方では解析できない。

George W. Bush

なぜかウィキペディア英語版で George W. Bush を調べ始めた。 43503 George W. Bush ジョージW.ブッシュ 3872 Efforts to impeach George W. Bush ジョージW.ブッシュを弾劾する努力 1354 Presidency of George W. Bush ジョージW.ブッシュ大統領 1115 Geor…

編集速度

センター試験非番に付き(笑)、いろいろと在宅勤務。 wikipedia の記事ごとの編集速度を出してみることにした。 日本語版の場合「日速」はならしてみると速くて10とか20くらいなので、 「週速」か「月速」くらいでないと、差が出ないようだ。 比較的新しい記…

IE 7...

このページの横メニューバーが firefox か IE 8 で見ると正常だが、IE 7 で見ると崩れることがわかった。 直さないと。 なんか直ったっぽい。 li を display: inline-block; にした。

授業風景

C#でUDPで一対一でチャットのようなこと。

学生と一緒にやったので、備忘録。 UDPによりデータの送受信を行う@dobon.net 参照。 PC 2つ使って送信受信するには送信と受信とそれぞれ別のループに入れないといけない。 つまりマルチスレッド。 なので【連載 】C#プログラミング入門 第7回:マルチスレッ…

ゼミ風景

Softimage Mod Tool Add-Ons

少しずつリハビリ。 Valve Source Add-Onのダウンロード場所がわからんようになったので直リンク。 Autodesk Softimage Mod Tool Add-Ons また変わるかもしれんが。

fget_csv 文字化け

php

php で csv を使おうと思ったのだが、 どうやら fget_csv() は日本語文字化けするらしい。 まあ、普通に正規表現で切り分ければいいんだが、 PHP5でfgetcsvが正常に動作しない に載ってるコードをほとんどそのまま使わせてもらった。

jawiki-20100107-pages-meta-history.xml.7z

さっそく処理開始。 さて、少しは速くなってくれたかな。 だめだ。 やはり GC.start は必要。

仮面ライダーディケイド/log20091223

とうとう「仮面ライダーディケイド」も2009年12月23日にログ落ちしたようだ。 そろそろ5000越えそうだから、年内にやっとくかというところか。

rbprof

RbProfを使ってみる。 Standard profiler (profile.rb) is slow (typically slows down your program by a factor of 60-200). Ruby 標準の profiler だとだいたい 60倍から 200倍遅くなる、と言っている。 Fast (typically 5-10 times faster than Ruby's s…

ruby profile

Ruby Profileって それ自体がかなり遅いようだな。 全然終わらんよ。 profile はそれ自身がオーバーヘッドになるためメソッド呼び出しあたりの処理時間がかなり遅くなります。 RAA - rbprof Profiler which is faster and more "to the point" than profile.…

ruby 周り

比較的ヒマなのと、リハビリを兼ねて Ruby をいじってみる。 fedora もいつのまにか 12 になってる。 fedora 11 では update しても ruby は 1.8.6 のまま。 1.8.7 または 1.9.1 では高速化しているというが、 1.9.1 使うと古いパッケージが動かない。 1.8.7…

mediawiki spammer

わざわざアカウント作成してまでリンクを張ろうとする spammer が居てびっくりした。 chaptcha を回避しようとしているので、bot であることは確かだろう。 つまり mediawiki 専門の spammer か。 リンク先をおそるおそる見てみたら「論文執筆代行」ページだ…

excel macro

vba

分けあってエクセルをばんばん使うようになったのだが、 CSV で書き出して Ruby かなんかで処理するのがめんどくさいので、 マクロを覚えることにした。 次のコードは temp という新しいシートを作って、 それ以外のシートの内容を全部 temp にコピーすると…

一ヶ月以内編集回数多い順

変化がないのも寂しいので 一ヶ月以内編集回数多い順 というのを作ってみた。

enwiki pages-meta-history.xml.bz2 202.7 GB

ダンプ開始から一ヶ月が過ぎ、年もあらたまったのに、まだダンプしてますね。