実体参照

今回は短いです。

みなさん、いままで見てきて不思議に思ったことはありませんでしたか。

そもそもタグとは、<で始まって>で終わるというものでした。良くサンプルを提示するとき、タグを使ったサンプルを提示してきましたね。


<p>p要素のサンプル</p> <!-- コメント -->

ここに、普通に「<p>」と書かれています。「<p>」と書いたらp要素ができて段落になるはずなのに、普通に「<p>」と書いてあるのはおかしいと思いませんか?

実は、そのように、タグなどを普通に表示させるのに、実体参照を使っているのです。

実体参照とは何かというと、ある文字を別の書き方で書き表す方法です。これにより、タグを構成する特殊な文字である「<」と「>」を実体参照で書くことで、タグとして扱われないようにしたということです。

具体的にはどう書くかというと、「<」は「&lt;」と書きます。「>」は「&gt」です。

この各カッコはもともと不等号なので、ltとは"less than"(より小さい)、 gtとは"greater than"(より大きい)の略です。

ところで、「&lt;」と書くと「<」に変わるなら、「&lt;」自体はどう書くのでしょう。実は「&」を表す実体参照があって、それは「&amp;」です。

だから、「&lt;」と画面上に表示させるには、「&amp;lt;」と書けばいいのです。

今までサンプルでタグが書かれていたのは、全てこの実体参照を使用していたのです。この、&lt;・&gt;・&amp;は、よく使われる代表的な実体参照です。

他によく使われるものとして、「&quot;」「&apos;」があります。これはぞれぞれ、ダブルクォート(")・アポストロフィー(')のことです。これの使い道は、例えば""で囲まれた属性の中でさらに"を使いたいときに使えます。


<img src="dog.png" alt="dog" title="This animal is called &quot;dog&quot;.(この動物は犬と呼ばれています。)">

名前による実体参照

今まで紹介した5つが最も基本的な実体参照で、何もしなくてもXML(興味があれば調べてみましょう)で使えるのはこの5つです。

しかし、HTMLでは他にもいろいろあります。

例えば、©というコピーライトマークは、「&copy;」で表示できます。他のも¥(円マーク)(半角の「\」とは違います)は「&yen;」などです。調べるとたくさん出てきます。

特に、「¥300」などと値段を書くとき、半角の「\」を使うと格好悪いので、ちゃんと&yen;を使うべきです。なぜなら、半角の「\」は、円マークに見えることもありますが世界的にはバックスラッシュといい、円マークではないからです。

文字コードによる実体参照

実体参照は、文字コードを使用することですべての文字を表せます。なぜなら、すべての文字には番号が付いているので、その番号を指定してやればその文字を表示してやることができるからです。

その方法は単純で、&#文字コード;というようにします。例えば、Unicodeの場合、「¥」(さっきの円記号)は165なので、「&#165;」とすれば、¥このように円記号が出ます。ただ、文字コードは16進数のほうが一般的です。165は16進数でA5ですが、16進数の場合には#の後にxを付けて「&#xA5;」のようにします。そうすると、やはり¥このように円記号が出ます。

全ての文字が表示可能です。例えば「あ」は、「&#x3042;」で表示できます。