クローラーとは?

ここでは、「クローラーとは?」 に関する記事を紹介しています。
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
ブログランキングに参加しています。
応援クリックよろしくお願いします。
banner_02.gif

e_03.gif






クローラー(Crawler)





クローラーとは、
各検索サイトや研究機関が
Webサイトの情報を収集するために
利用している
自動巡回ロボットのことです。





ロボット、
あるいはスパイダーと
呼称することもあります。






HTMLに記載されている
リンクをたどることで,
世界中のWWWサイトを検索する。





複数のクローラー用サーバ機
を使って並列処理することで,
短時間で大量のデータを収集します。





サーチ・エンジンでは
クローラーを使って回収した
WWWサイトの内容を
データベース化して保存し,





検索要求が発生すると
データベースを検索して結果を表示する。





クローラーが集める
文書ファイルからは、




(1)テキスト情報



(2)ファイル情報



(3)HTMLのタグ情報



(4)リンク情報




の4つの情報が抽出される。


この情報を整理して
データベースを作り上げています。



ご質問、ご相談等ありましたら、
お気軽にどうぞ♪
メールフォーム



人気blogランキングへ
FC2 blogランキングへ






スポンサーサイト
コメント
この記事へのコメント
ナトリウムは食塩のことです http://mayoress.crosstudio.net/
2008/11/21(金) 14:21 | URL | #-[ 編集]
コメントを投稿する
URL:
Comment:
Pass:
秘密: 管理者にだけ表示を許可する
 
トラックバック
この記事のトラックバックURL
http://suc2007.blog118.fc2.com/tb.php/39-25d5b1ee
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。