▽19980306g
#日記
とりあえず,みつけた情報(約3700件)
を揃えてえりこに ICQ で送ってみたら,
どーやら社で好評だったようだ (^_^
手順:ダウンロードしてきた複数 HTML の <table> に記された情報を,
- 全ファイルから病院名と住所の行だけを抜き出す
- 余計なタグ情報を切り取る
- 名と住所を組みにして "," で区切って出力
#!/usr/local/bin/perl
{
while( <> ){
# 改行をカット
chomp;
# 機関名 or 住所 の行以外は読み飛ばし
next unless /TD ROWSPAN/i or /TEL/i;
# タグをカット
s/<[^>]+>//g;
# とりあえず保存
push @data, $_;
}
# 2個ずつ組みにして出力
for( $i = 0; $i < @data; $i += 2 ){
print join( ',', @data[ $i, $i+1 ] ), "\n";
}
}