index

1998年 2月
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28  
1998年 3月
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31          
1998年 4月
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30      

アレ

  ▽19980306g #日記

とりあえず,みつけた情報(約3700件) を揃えてえりこに ICQ で送ってみたら, どーやら社で好評だったようだ (^_^
手順:ダウンロードしてきた複数 HTML の <table> に記された情報を,

  1. 全ファイルから病院名と住所の行だけを抜き出す
  2. 余計なタグ情報を切り取る
  3. 名と住所を組みにして "," で区切って出力
これを .csv のファイル名で保存すると, ほとんどのユーザにとって扱いやすい形式にする事ができる. あー,今思えば,住所と電話番号も別項目に区切るべきだったか... 区切ったバージョンが欲しければ言ってね,すぐ作れるから > えり


#!/usr/local/bin/perl
{
	while( <> ){
		# 改行をカット
		chomp;
		# 機関名 or 住所 の行以外は読み飛ばし
		next unless /TD ROWSPAN/i or /TEL/i;
		# タグをカット
		s/<[^>]+>//g;
		# とりあえず保存
		push @data, $_;
	}
	# 2個ずつ組みにして出力
	for( $i = 0; $i < @data; $i += 2 ){
		print join( ',', @data[ $i, $i+1 ] ), "\n";
	}
}

index