Blog Park ブログ內(nèi)の畫像をクロールするための小さなコードを書きました。このコードは一部のリンクでは有効ですが、一部のリンクはクロールされるとすぐにエラーを報(bào)告します。理由は何ですか?
リーリー図に示すように、畫像は正しくクロールできます
URLを
に変更した場(chǎng)合 リーリーその後、すぐにエラーを報(bào)告してください
解決してください、ありがとう!
Web ページのソース コードを見ると、エラー メッセージはすでに非常に明白です。一致する最初の畫像は GIF 形式であり、まだ相対パスであるため、ダウンロードできないため、IOerror が表示されます。ダウンロードした場(chǎng)合、形式を JPG として指定したため、開くことができません。 したがって、必要なのは判斷してフィルタリングすることだけです
リーリーもちろん、これは最も単純な判斷にすぎませんが、2 番目のプログラムがエラーを報(bào)告しないようにすることができ、またアイデアも得られます。