Veritas et Libertas
字符编码那些事 字符编码那些事
阅读 Java Core 的过程中遇到了 Code Point、Code Unit等术语,借机深挖了编码相关知识。此篇为笔记整理,非完全原创。 1. 字符编码小史 TL;DR. 如果对字符编码有一定了解,可以直奔文末
BOM? BOMB! BOM? BOMB!
本文是编码系列文章的延伸,建议先食用 编码那些事儿一文。 1. 什么是BOM?BOM是用来判断文本文件是哪一种 Unicode 编码的标记,其本身是一个 Unicode 字符 \uFEFF,位于文本文件头部,让我们可以根据文件头部的几个字节