▽20010205e
#日記
どこぞのページからデータをぶっこ抜きたいとゆー要請が. 全国 47県が別ページで,それぞれが最高 7000件ほどのデータを持っていて, こいつを「検索条件なし」で検索すると全件が対象になるわけだが, 検索結果表示ページが「20件/ページ 固定」で, 「次の 20件」ボタンはあるが「前の 20件」ボタンはないとゆー, どーにもエレガントなページだ.
で,まぁ,まず Iria で「リンクのインポート」を使って全ページを取得し, この HTML を perl で編集っつーか抽出してデータだけを取り出そう, って事で,ダウンロードだけ仕込んで帰宅(ぉ