{〈Unicode〉}{UTF-8}{文字列型}{Ruby言語}{料型}{文字符号化方式}(6)
B̅
{hachi8833,morimorihoge,baba:著「Rubyの内部文字コードはUTF-8ではない…だと…?!」,『TechRacho』(BPS株式会社)。2020-11-27 K#D657/69CA}
https://techracho.bpsinc.jp/hachi8833/2020_11_27/26969
多くの言語では内部でUnicodeを用いています。言い方を変えれば、文字コードを固定してそれ以外のコードについては変換のみで対応する
[...]
UCS正規化を採用している言語では、たとえばStringクラスなどで原則としてその文字コードしか保存できません。
Rubyは1.9でCSI(Code Set Independent)という独自の多言語化方式を導入
[...]
CSI方式では特定の内部コードを仮定しません。
たとえばStringクラスの変数にはその気になればUnicode以外の文字コードでも直接保存できます。
つまり文字列は内部的に事実上バイナリとして保存されている
[...]
その代わりStringクラスで文字コード情報を持てるようにする
接触
2023-05-10
2020.11.27
Rubyの内部文字コードはUTF-8ではない…だと…?!|TechRacho by BPS株式会社
https://techracho.bpsinc.jp/hachi8833/2020_11_27/26969
{hachi8833,morimorihoge,baba:著「Rubyの内部文字コードはUTF-8ではない…だと…?!」,『TechRacho』(BPS株式会社)。2020-11-27}(1)
B̅
{接触/20230510 K#D657/B777}
2023-05-10
2020.11.27
Rubyの内部文字コードはUTF-8ではない…だと…?!|TechRacho by BPS株式会社
https://techracho.bpsinc.jp/hachi8833/2020_11_27/26969
{hachi8833,morimorihoge,baba:著「Rubyの内部文字コードはUTF-8ではない…だと…?!」,『TechRacho』(BPS株式会社)。2020-11-27}{成瀬 ゆい『Ruby M17Nの設計と実装』。2009-02-12}(2)
B̅