PHPプログラムに関する各種メモ書き

PHPによるウェブサイトクローラー

■ サイトクローラー(巡回ロボット)クラス phpcrawl

・http://sourceforge.net/projects/phpcrawl/

※ phpcrawl には下記の不具合があります(2007.01.23現在)

・URI正規化が出来ない

・巡回間隔を設定できない(一気にアクセスしに行く)

・HTTPステータス 403 を理解しない


関連エントリー

No.433
08/23 19:48

edit