{5S}(1)
{5S}(1)
{清掃}(1)
{〈Unicode〉}{UTF-8}{文字列型}{Ruby言語}{料型}{文字符号化方式}(6)

{hachi8833,morimorihoge,baba:著「Rubyの内部文字コードはUTF-8ではない…だと…?!」,『TechRacho』(BPS株式会社)。2020-11-27 K#D657/69CA}

https://techracho.bpsinc.jp/hachi8833/2020_11_27/26969

(2023-05-10閲覧)

多くの言語では内部でUnicodeを用いています。言い方を変えれば、文字コードを固定してそれ以外のコードについては変換のみで対応する
[...]
UCS正規化を採用している言語では、たとえばStringクラスなどで原則としてその文字コードしか保存できません。

Rubyは1.9でCSI(Code Set Independent)という独自の多言語化方式を導入
[...]
CSI方式では特定の内部コードを仮定しません。
たとえばStringクラスの変数にはその気になればUnicode以外の文字コードでも直接保存できます。
つまり文字列は内部的に事実上バイナリとして保存されている
[...]
その代わりStringクラスで文字コード情報を持てるようにする

接触

2023-05-10

2020.11.27
Rubyの内部文字コードはUTF-8ではない…だと…?!|TechRacho by BPS株式会社
https://techracho.bpsinc.jp/hachi8833/2020_11_27/26969

{}