编码
文本可以有多种方式编码。最(古老)的文本文件使用 ANSI 格式编码,这种编码只支持数量很少的字符集,但是却是字符显示最有效的一种方式。Unicode编码支持更多数量字符集,可以是单个文件一次包含多种语言的字符,但是会而外增加文件的大小。Notepad++ 在打开一个文件时,会自动探测文件的编码方式,你也可以在编辑文件的时候改变文件的编码方式。如果你只是想改变文档显示的编码的话(不是真的改变文档的编码方式),可以从格式菜单中选择 。要转换文本的编码,从格式菜单中选择一种编码
有时你会发现,你用某种编码保持文件,但是当你重新打开文件是,Notepad++ 却以自动探测的另一种编码打开文件。这是技术上的某种局限,因为有时候虽然使用了其他的编码打开文件,但是文件的内容并没有发生变化。如果文件保存的时候并没有用BOM(字节序标识符)指明文件的编码的话,Notepad++ 就会自动探测文件的编码。
Notepad++ 支持一下编码方式:
- ANSI
- 最古老的编码方式,文件大小最小,但是由于使用不同的码页很容易出错。
- UTF-8
- Unicode 编码,最常用的西文字符每个都占1个字节,其他语言字符最多会占到3到4个字节。在文档保持时,会在文档的开头加上3个字节的BOM。
- UTF-8 without BOM
- 和UTF-8类似,但是不会在文档开头加BOM。因此可以节省3个字节的文件大小,但是会给编码探测带来困难。
- UTF-16 低位在前
- 所有的字符都是2个字节,低位在前。在保存的时候在文档开头加上2个字节的BOM。
- 所有的字符都是2个字节,高位在前。在保存的时候在文档开头加上2个字节的BOM。
- UTF-16 Big Endian
另外,从版本5.6开始,Notepad++ 支持在显示的时候改变字符集,就像大多数Web浏览器一样。在你单击 菜单(在之后的那项菜单)时,会弹出可以所支持的编码字符集。
注意,对于HTML和XML 文档,Notepad++ 会在文档打开的时候试图探测文件的编码,这样是为了避免文件部署到服务器后可能会出现的编码错误问题。

