- \t
	
- \n


{文字参照 K#D657/B853}
HTML現存標準
HTML現存標準において,HTML文書の構文はXMLと厳密な互換性を持たずに定義されており,したがってHTMLにおける文字参照はXMLにおける文字参照とは規格の上ではなんら関係のない構文である。じっさい,当該構文の定義においては,XML文字参照について一切の言及がない。
ただし,字面や意味論について見ると,両者はほとんど同一である。これは,旧規格においてはHTML構文がSGMLの部分集合として定義されていたりしたために,SGMLとXMLの関係性および現規格における過去互換性の考慮などが絡み合った結果だと推測できる。
character reference
https://html.spec.whatwg.org/multipage/syntax.html#syntax-charref
- 十進文字参照
- 十六進文字参照
{文字参照 K#D657/772C}
XML 1.0
character reference
https://www.w3.org/TR/2008/REC-xml-20081126/#dt-charref
定義
ISO/IEC 10646文字集合 (規格が参照している文献は,正確にISO/IEC 10646-1:2000—情報技術—万国多バイト符号化文字集合 (UCS)—第1部: 設計および基本多言語面) における特定の文字を参照する。
仕様
&#
から始まり;
で終結する10進数値または&#x
から始まり;
で終結する16進数値によって,ISO/IEC 10646文字集合の文字符号点を指し示す。
{文字参照 K#F85E/C36E}
(もじさんしょう,英:character reference)
XML や HTML などの標記言語において,所定の記法で文字を間接的に表現する方法。
例えば HTML では,<
や >
のように構文上直接記述できない予約文字を <
,>
と書いて「<」「>」と表示させることができる。 このように予約文字を標記される対象として記述したい場合のほか,非図形文字や空白類のような視認しにくい文字,字形の紛らわしい文字,入力しにくい文字などを厳密に記述することに役立つ。
HTML では,ISO/IEC 10646(Unicode にほぼ相当)の符号点を十進数または十六進数で記述する「数値文字参照」と,予め定義された文字名で記述する「文字実体参照」の2種類の方法がある。前者(例:α
→ α)は直感性に劣るものの符号点で示せる文字は全て扱うことができ,後者(例:α
→ α)は直感性に優れるものの予め定義された少数の文字しか扱えない。
なお,HTML でいう文字実体参照は XML においては実体参照というマクロ的な仕組みの単なる応用で,定義済み文字も最小限であり,単に文字参照といえば HTML の数値文字参照に相当する方法を指す。
デライトの標記言語であるデラングでは,HTML の文字参照と互換性のある文字参照記法を実装している。