今回はWeb、その中でもHTTPの部分の話です。世の中にはさまざまなブラウザがあり、非常に高機能なものが多いです。でも、それらが提供している機能のうち一番の基礎となる通信部分に関してはかなりシンプルです。
HTTPとは
まず、はじめにHTTPとは何か?という点に関してです。HTTPはHyper Text Transfer Protocolの略で、Hyper Textを転送するための手続きだ、というわけですね。Hyper Textというのはテキストを超えるものだ、ということです。そして、Hyper Textを書く手段がHTMLで、そのHTMLを伝える手段がHTTPなわけです。このあたりはWikipediaに説明を譲ります。
- [Hypertext Transfer Protocol - Wikipedia](http://ja.wikipedia.org/wiki/HTTP)
- [ハイパーテキスト – Wikipedia](http://ja.wikipedia.org/wiki/%E3%83%8F%E3%82%A4%E3%83%91%E3%83%BC%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88)
- [HyperText Markup Language – Wikipedia](http://ja.wikipedia.org/wiki/HyperText_Markup_Language)
要は世の中に沢山あるWebサーバーから情報をひっぱってこようとおもったら、HTTPでおしゃべりすればいい、ということです。
Webページを取得してみる
それでは実際にやってみましょう。やってみると簡単ですよ。簡単なページが良いので、いつものようにGoogleのページを引っ張ってきてみましょう。
まずは、googleのWebサーバーであるwww.google.co.jpに接続します。WebサーバーはTCPの80番で動作していますので80番に接続します。
接続に成功すると何も表示されない状態になります。それで正常です。この状態でWebサーバーに対してページを要求します。以下のように入力します。
入力する際に、自分では自分が入力している文字が見えませんがそのまま打てば良いです。そして入力後にはEnterを2回押します。
これで以下のようにgoogleのトップページのHTMLが入手できます。
ブラウザでwww.google.co.jpのトップページに行き、ソースを表示すると、まったく同じものが入手できていることがわかると思います。ブラウザが裏でまったく同じ事をしている、ということが実感できるのではないかと思います。
説明すべきことはまだまだ沢山あるのですが、まずはこれが基本です。色々なWebサイトに対して接続、リクエストしてみて楽しんでみて下さい。