更新検知のテスト

メインアカで登録しているとあるページの更新が検出されない.手動更新を行っても「内容が更新されていません。」と言われる.なお,これは新巡回システムへのリプレース以前からの現象である.
何が原因か自分で調べられる範囲で調べようと思ったのだが,ヘルプには更新検地方法についてはほとんどドキュメント化されてないようだ.その代わり,お問い合わせにはそれなりの解説がある.

はてなアンテナの更新チェックは、まず巡回先のページを取得し、そこからHTMLタグを取り除いた内容を前回の内容と見比べ、変化があった場合にのみ更新されたとみなし、その変化した文字を更新内容として記録しています。

あたりが今回知りたかったことだが,特に問題はなさそうなんだけどー.ということでテスト.formの使い方が間違っているという指摘は却下です.
==ここから更新開始==

==ここまで更新==

手動更新の結果

見事に「ここから」から「ここまで」の間がスルーされましたよ.

(snip)
あたりが今回知りたかったことだが,特に問題はなさそうなんだけどー.ということでテスト.formの使い方が間違っているという指摘は却下です.
==ここから更新開始==
==ここまで更新==

念のため,formの中を更新してからもう一度チェックしてみます.→やっぱり検知されず.

HTMLタグの除去

<form><select name="履歴" size="3">
<option value="06/07/16">7/17 トップページを更新</option>
<option value="06/07/15">7/16 どこかのページを更新</option>
<option value="06/07/14">7/15 あそこのページを更新</option>
</select></form>

ここからHTMLタグを取り除くと,

7/17 トップページを更新
7/16 どこかのページを更新
7/15 あそこのページを更新

になるはずでは.そして,前回の内容との比較対象になるはずですよね.HTMLタグを取り除くアルゴリズムがおかしいのかしらん?perlではどうやるものなのかよくわからないので,phpでstrip_tags()してみましたが,問題なく「7/17 トップページを更新」などの文字列が残りましたけど.
うーん,わからん.巡回システムの更新が終わっても改善しなかったら問い合わせよう.