在打开和保存文件时选择文本编码

重要:  本文是由机器翻译的,请参阅免责声明。请在 此处 中查找本文的英文版本以便参考。

通常,在共享文本文件时,您不必考虑有关文本的存储方式的底层详细信息。不过,如果您要与使用其他语言的用户共享文本文件、从 Internet 下载文本文件,或与其他计算机系统共享文本文件,那么,在打开或保存文件时,则可能需要选择编码标准。

当您或其他人打开一个文本文件 Microsoft Word 中还是在其他程序 — 可能是在用于创建该文件的语言不同语言的系统软件的计算机上-编码标准帮助确定如何表示文本,以便可以读取该程序。

你想如何操作?

了解文本编码

在打开文件时选择编码标准

在保存文件时选择编码标准

查找 Word 中的可用编码标准

了解文本编码

实际上,作为文本文件中的数值存储什么向您显示为屏幕上的文本。您的计算机将数值转换为可见的字符。这是通过使用一种编码标准。

一种编码标准是分配每个字符设置为数字值中的文本字符的编号方案。字符集可以包含字母、 数字和其他符号。在不同语言通常包含不同的字符,因此许多不同的编码标准存在来表示在不同语言中使用的字符集。

用于不同字母表的不同编码标准

文本文件中保存的编码标准提供您的计算机需要在屏幕上显示的文本的信息。例如,在中的西里尔文 (Windows) 编码字符 Й 具有数值 201。当您打开包含此字符使用西里尔文 (Windows) 编码的计算机上的文件时,计算机读取数值 201,并在屏幕上显示 Й。

但是,如果您打开使用不同的编码的计算机上的同一个文件,计算机将显示对应于默认情况下使用计算机的编码标准 201 数字值的任何字符。例如,如果您的计算机使用西欧 (Windows) 编码标准,基于西里尔文的原始文件中的字符将会显示为 É 而不是 Й 因为在西欧 (Windows) 编码,价值 201 映射到 É。

Unicode:一种编码标准涵盖众多字母表

若要避免出现问题编码和解码文本文件,您可以以 Unicode 编码保存文件。Unicode 容纳跨所有语言常用之间计算机用户今天的大多数字符设置。

由于 Word 基于 Unicode,Word 自动以 Unicode 编码的形式保存文件。不论文件中的文本是什么语言,您都能在英语计算机系统上打开和读取 Unicode 编码的文件。同样,在使用英语系统保存 Unicode 编码的文件时,文件可以包含西欧字母表中没有字符,如希腊语、西里尔文、阿拉伯语或日语字符。

返回页首

在打开文件时选择编码标准

如果您打开文件时,文本将显示模糊或为问号或框中,Word 无法准确地检测文本的编码标准文件中。您可以指定要用于显示的编码标准 (解码) 文本 ︰

  1. 单击“文件”选项卡。

  2. 单击“选项”。

  3. 单击“高级”。

  4. 滚动到常规部分,然后选择打开时确认文件格式转换复选框。

    注意: 选中此复选框后,Word 将显示转换文件对话框中,您每次打开文件的格式以外的其他 Word 格式 (Word 格式包括.doc、.dot、.docx、.docm、.dotx 或.dotm 文件)。如果您经常处理此类文件,但很少想要选择一种编码标准,请记住要关闭此选项以避免不必要地打开此对话框。

  5. 关闭并重新打开该文件。

  6. “转换文件”对话框中,选择“编码文本”

  7. “文件转换”对话框中,选择“其他编码”,然后从列表中选择所需的编码标准。

    您可在“预览”区域预览文本,以检查所有文本在采用所选的编码标准时是否都能正常显示。

如果几乎所有文本的显示都相同(例如,全部显示成方框或点),则可能未安装显示字符所需的字体。如果需要的字体不可用,则可安装这些字体。

要安装其他字体,请执行下列操作 ︰

  1. 在 Microsoft Windows 中,单击“开始”按钮,再单击“控制面板”

  2. 请执行下列操作之一:

    在 Windows 7 中

    1. 在“控制面板”中,单击“卸载程序”

    2. 在程序列表中,单击 Microsoft Office 或 Microsoft Word 中,具体取决于您是否安装 Word 作为 Office 的一部分或单个程序的列表,然后单击更改

    在 Windows Vista 中

    1. 在“控制面板”中,单击“卸载程序”

    2. 在程序列表中,单击列表中的 Microsoft Office 或 Microsoft Word(具体单击哪一项取决于 Word 是作为 Office 的一部分安装的还是单独安装的),然后单击“更改”

    在 Microsoft Windows XP 中

    1. 在“控制面板”中,单击“添加或删除程序”

    2. “当前安装的程序”框中,单击列表中的 Microsoft Office 或 Microsoft Word,这取决于 Word 是作为 Office 的一部分安装的还是单独安装的,然后单击“更改”

  3. “更改您的 Microsoft Office 安装”下,单击“添加或删除功能”,然后“继续”

  4. 安装选项中,展开Office 共享功能,然后展开国际支持

  5. 选择所需的字体集,单击所选内容旁边的箭头,然后选择“从本机运行”

提示: 当您打开编码的文本文件时,Word 应用的Web 选项对话框中定义的字体。(到达Web 选项对话框中,单击Microsoft Office 按钮、 单击Word 选项,然后单击高级。在常规部分中,单击Web 选项。)在Web 选项对话框中,若要自定义的每个字符集的字体,您可以选择字体选项卡上的选项。

返回页首

在保存文件时选择编码标准

如果在保存文件时不选择编码标准,Word 将以 Unicode 的形式对文件进行编码。通常,您可以使用默认的 Unicode 编码,因为它支持大多数语言中的大多数字符。

如果文档将在不支持 Unicode 的程序中打开,则可选择与目标程序的编码标准相匹配的编码标准。例如,Unicode 允许在英语系统上创建繁体中文的文档。不过,如果要在不支持 Unicode 的繁体中文程序中打开文档,则可将文档保存为繁体中文 (Big5) 编码。当在繁体中文程序中打开文档时,所有文本都能正确显示。

注意: 由于 Unicode 是最全面的标准,因此,以任何其他编码保存文件都可能导致不能显示某些字符。例如,采用 Unicode 编码的文档可能包含希伯来语和西里尔文文本。如果以西里尔文 (Windows) 编码保存该文档,则不能再显示希伯来语文本,如果以希伯来语 (Windows) 编码保存该文档,则不能再显示西里尔文文本。

如果选择的编码标准不支持文件中使用的字符,Word 会将无法保存的字符标为红色。您可在保存文件之前,以所选的编码标准预览文本。

将文件保存为编码文本时,文本设置格式或 Symbol 字体中域代码是从文件中删除。

选择编码标准

  1. 单击“文件”选项卡。

  2. 单击“另存为”

    如果要将文件保存在不同的文件夹中,请找到并打开该文件夹。

  3. “文件名”框中,键入文件的新名称。

  4. “保存类型”框中,选择“纯文本”

  5. 单击“保存”

  6. 如果显示Microsoft Office Word 兼容性检查器对话框中,单击继续

  7. “文件转换”对话框中,选择与要用的编码标准对应的选项:

    • 要使用系统的默认编码标准,请单击“Windows(默认)”

    • 要使用 MS-DOS 编码标准,请单击“MS-DOS”

    • 要选择特定的编码标准,请单击“其他编码”,然后从列表中选择所需的编码标准。您可在“预览”区域预览文本,以检查所有文本在采用所选的编码标准时是否都能正常显示。

      注意: 您可调整“文件转换”对话框的大小,以便能预览文档的更多内容。

  8. 如果出现消息“标为红色的文字将无法用所选编码正确保存”,则可尝试选择另一不同的编码,或者可以选中“允许字符替换”复选框。

    在允许字符替换时,Word 将不能显示的字符替换为所选编码中最相近的对等字符。例如,用三个点替换省略号,用直引号替换弯引号。

    如果所选编码中没有标为红色的字符的对等字符,则将标为红色的字符保存为脱离上下文的字符,如问号。

  9. 如果文档将在不支持文本换行的程序中打开,则可在文档中包含硬换行符,方法是选中“插入换行符”复选框,然后在“行终止符号”框中指定是用回车 (CR)、换行 (LF) 还是同时使用两者来表示换行符。

返回页首

查找 Word 中的可用编码标准

Word 识别多种编码标准,并支持随计算机上的系统软件一起提供的编码标准。

下面的书写系统列表显示与每种书写系统相关的编码标准(也称为代码页)。

书写系统

编码标准

应用的字体

多语言

Unicode(UCS-2 little-endian 和 big-endian、UTF-8、UTF-7)

基于您的语言版本的 Word 中“标准”样式的默认字体

阿拉伯语

Windows 1256、ASMO 708

Courier New

简体中文

GB2312、GBK、EUC-CN、ISO-2022-CN、HZ

宋体

繁体中文

BIG5、EUC-TW、ISO-2022-TW

MingLiU

西里尔语

Windows 1251、KOI8-R、KOI8-RU、ISO8859-5、DOS 866

Courier New

英语、西欧或其他拉丁脚本

Windows 1250、1252-1254、1257、ISO8859-x

Courier New

希腊语

Windows 1253

Courier New

希伯来语

Windows 1255

Courier New

日语

Shift-JIS、ISO-2022-JP (JIS)、EUC-JP

MS Mincho

朝鲜语

Wansung、Johab、ISO-2022-KR、EUC-KR

微软雅黑

泰语

Windows 874

Tahoma

越南语

Windows 1258

Courier New

印度语:泰米尔语

ISCII 57004

Latha

印度语:尼泊尔语

ISCII 57002 (Devanagari)

Mangal

印度语:贡根语

ISCII 57002 (Devanagari)

Mangal

印度语:印地语

ISCII 57002 (Devanagari)

Mangal

印度语:阿萨姆语

ISCII 57006

印度语:孟加拉语

ISCII 57003

印度语:古吉拉特语

ISCII 57010

印度语:卡纳达语

ISCII 57008

印度语:马拉雅拉姆语

ISCII 57009

印度语:奥里雅语

ISCII 57007

印度语:马拉地语

ISCII 57002 (Devanagari)

印度语:旁遮普语

ISCII 57011

印度语:梵语

ISCII 57002 (Devanagari)

印度语:泰卢固语

ISCII 57005

注意: 

  • 使用印度语需要系统支持和相应的 OpenType 字体。

  • 对于尼泊尔语、阿萨姆语、孟加拉语、古吉拉特语、马拉雅拉姆语和奥里雅语,仅提供有限支持。

返回页首

注意: 机器翻译免责声明:本文是由无人工介入的计算机系统翻译的。Microsoft 提供机器翻译是为了帮助非英语国家/地区用户方便阅读有关 Microsoft 产品、服务和技术的内容。由于机器翻译的原因,本文可能包含词汇、语法或文法方面的错误。

此信息是否有帮助?

很好! 还有其他反馈吗?

我们应该如何改进?

谢谢您的反馈!

×