{超文書標記言語}{文字参照}{HTML現存標準}(3)

{文字参照 K#D657/B853}

HTML現存標準

HTML現存標準において,HTML文書の構文はXML厳密な互換性を持たずに定義されており,したがってHTMLにおける文字参照XMLにおける文字参照とは規格の上ではなんら関係のない構文である。じっさい,当該構文の定義においては,XML文字参照について一切の言及がない。
ただし,字面や意味論について見ると,両者はほとんど同一である。これは,旧規格においてはHTML構文がSGMLの部分集合として定義されていたりしたために,SGMLとXMLの関係性および現規格における過去互換性の考慮などが絡み合った結果だと推測できる。

character reference

https://html.spec.whatwg.org/multipage/syntax.html#syntax-charref

  • 十進文字参照
  • 十六進文字参照
{『可拡標記言語 (XML) 1.0 第5版』(W3C)。2008-11-26}{文字参照}{可拡張標記言語}{文字}(4)

{文字参照 K#D657/772C}

XML 1.0

character reference

https://www.w3.org/TR/2008/REC-xml-20081126/#dt-charref

定義

ISO/IEC 10646文字集合 (規格が参照している文献は,正確にISO/IEC 10646-1:2000—情報技術—万国多バイト符号化文字集合 (UCS)—第1部: 設計および基本多言語面) における特定の文字を参照する。

仕様

&#から始まり;で終結する10進数値または&#xから始まり;で終結する16進数値によって,ISO/IEC 10646文字集合の文字符号点を指し示す。

{文字}{もじさんしょう}{HTML}{XML 用語}{〈character reference〉}{HTML 用語}{参照}{XML}{素描}(9)

{文字参照 K#F85E/C36E}

もじさんしょうcharacter reference

XMLHTML などの標記マークアップ言語において,所定の記法文字間接的に表現する方法

例えば HTML では,<> のように構文上直接記述できない予約文字&lt;&gt;書いて<」「>」と表示させることができる。 このように予約文字標記される対象として記述したい場合のほか,非図形文字空白類のような視認しにくい文字字形紛らわしい文字入力しにくい文字などを厳密に記述することに役立つ

HTML では,ISO/IEC 10646Unicodeほぼ相当符号点コードポイント十進数または十六進数記述する数値文字参照」と,予め定義された文字名記述する文字実体参照」の2種類方法がある。前者(例:&#x03B1; → α)直感性劣るものの符号点示せる文字全て扱うことができ後者(例:&alpha; → α)直感性優れるものの予め定義された少数文字しか扱えない

なお,HTML でいう文字実体参照XML においては実体参照というマクロ的な仕組み単なる応用で,定義済み文字最小限であり,単に文字参照といえば HTML数値文字参照相当する方法指す

デライト標記言語であるデラングでは,HTML文字参照互換性のある文字参照記法実装している


{}