xmlパーザの dom と sax

xml のパーザには dom (document object model)と sax (simple api for xml)があって、 dom は xml を一度に読み込んで木構造を保持するもの。 sax は xml を順番に読み込んで要素が見つかるたびに処理をするもの、らしい。 なるほど、 比較的短い xml は dom で解析した方が融通が利くが、 wikipedia のダンプデータなどは sax で読み込めば良いというわけだ。