在打开和保存文件时选择文本编码

注意: 我们希望能够尽快以你的语言为你提供最新的帮助内容。本页面是自动翻译的,可能包含语法错误或不准确之处。我们的目的是使此内容能对你有所帮助。可以在本页面底部告诉我们此信息是否对你有帮助吗?请在此处查看本文的英文版本以便参考。

通常, 你可以共享文本文件, 而无需担心文本存储方式的基本详细信息。但是, 如果您与使用其他语言的用户共享文本文件、在 Internet 上下载文本文件或与其他计算机系统共享文本文件, 那么您可能需要在打开或保存文件时选择编码标准。

当您或其他人在 Microsoft Word 或其他程序中打开文本文件时 (可能在计算机上的系统软件的语言与用于创建文件的语言不同) 时, 编码标准有助于该程序确定如何表示文本, 使其可读。

希望执行什么操作?

了解文本编码

在打开文件时选择编码标准

保存文件时选择编码标准

查找 Word 中可用的编码标准

了解文本编码

当屏幕上的文本实际以数值的形式存储在文本文件中时, 将显示这些内容。你的计算机会将数字值转换为可见字符。它通过使用编码标准来执行此操作。

编码标准是一种编号方案, 用于将字符集中的每个文本字符分配给一个数值。字符集可以包含字母字符、数字和其他符号。不同的语言通常由不同的字符集组成, 因此有许多不同的编码标准可用于表示在不同语言中使用的字符集。

不同字母表的不同编码标准

与文本文件一起保存的编码标准提供了计算机在屏幕上显示文本所需的信息。例如, 在西里尔文 (Windows) 编码中, 字符Й的数字值为201。当您在使用西里尔文 (Windows) 编码的计算机上打开包含此字符的文件时, 计算机将读取201数值, 并在屏幕上显示Й。

但是, 如果在使用不同编码的计算机上打开相同的文件, 则计算机会显示与默认情况下计算机使用的编码标准中的201数值相对应的任何字符。例如, 如果你的计算机使用的是西欧 (Windows) 编码标准, 基于西里尔文的原始文件中的字符将显示为É而不是Й, 因为在西欧字符 (Windows) 编码中, 值201映射到É。

Unicode: 许多字母表的一个编码标准

若要避免对文本文件进行编码和解码时遇到问题, 您可以通过 Unicode 编码保存文件。Unicode 可容纳大多数在计算机用户的常用语言中设置的大多数字符。

由于 word 基于 unicode, 因此 word 会自动保存编码为 unicode 的文件。您可以在英语语言的计算机系统上打开和读取 Unicode 编码文件, 而无需考虑文本的语言。同样, 当你使用英语语言系统保存编码为 Unicode 的文件时, 该文件可以包含在西欧字母表中未找到的字符, 如希腊语、西里尔文、阿拉伯语或日语字符。

返回首页

在打开文件时选择编码标准

如果在打开文件时, 文本出现乱码或问号或框, 则 Word 可能没有准确检测到文件中文本的编码标准。你可以指定可用于显示 (解码) 文本的编码标准。

  1. 单击“文件”选项卡。

  2. 单击“选项”

  3. 单击“高级”。

  4. 滚动到 "常规" 部分, 然后选中 "打开时确认文件格式转换" 复选框。

    注意: 选中此复选框后, 每次以 word 格式以外的格式打开文件时, word 会显示 "转换文件" 对话框 (word 格式包括 .doc、.dot、.docx、.docm、.dotx 或 normal.dotm 文件)。如果你经常处理此类文件, 但很少想要选择编码标准, 请记住关闭此选项以防止不必要地打开此对话框。

  5. 关闭并重新打开该文件。

  6. 在 "转换文件" 对话框中, 选择 "编码文本"。

  7. 在 "文件转换" 对话框中, 选择 "其他编码", 然后从列表中选择所需的编码标准。

    你可以在预览区域中预览文本, 以检查是否可在所选编码标准中阅读所有文本。

如果几乎所有文本的外观相同 (例如, 所有框或所有点), 则可能不会安装显示字符所需的字体。如果所需字体不可用, 则可以安装其他字体。

若要安装其他字体, 请执行下列操作:

  1. 在 Microsoft Windows 中,单击“开始”按钮,然后单击“控制面板”

  2. 执行下列操作之一:

    在 Windows 7 中

    1. 在 "控制面板" 中, 单击 "卸载程序"。

    2. 在程序列表中, 单击 "microsoft Office" 或 "microsoft Word" 的列表, 具体取决于您是作为 Office 的一部分还是作为单个程序安装的 word, 然后单击 "更改"。

    在 Windows Vista 中

    1. 在 "控制面板" 中, 单击 "卸载程序"。

    2. 在程序列表中, 单击 "microsoft Office" 或 "microsoft Word" 的列表, 具体取决于您是作为 Office 的一部分还是作为单个程序安装的 word, 然后单击 "更改"。

    在 Microsoft Windows XP 中

    1. 在 "控制面板" 中, 单击 "添加或删除程序"。

    2. 在 "当前安装的程序" 框中, 单击 "microsoft Office" 或 "microsoft Word" 的列表, 具体取决于你是作为 Office 的一部分还是作为单个程序安装的 word, 然后单击 "更改"。

  3. 在 "更改 Microsoft Office 安装" 下, 单击 "添加或删除功能", 然后单击 "继续"。

  4. 在 "安装选项" 下, 展开 " Office 共享功能", 然后展开 "国际支持"。

  5. 选择所需的字体集, 单击所选区域旁边的箭头, 然后选择 "从本机运行"。

提示: 当您打开编码的文本文件时, Word 会应用在 " Web 选项" 对话框中定义的字体。(若要访问 " Web 选项" 对话框, 请单击 " Microsoft Office 按钮", 单击 " Word 选项", 然后单击 "高级"。在 "常规" 部分中, 单击 " Web 选项"。您可以在 " Web 选项" 对话框中选择 "字体" 选项卡上的选项来自定义每个字符集的字体。

返回首页

保存文件时选择编码标准

如果在保存文件时未选择编码标准, Word 会将该文件编码为 Unicode。通常, 你可以使用默认的 Unicode 编码, 因为它支持大多数语言的大多数字符。

如果你的文档将在不支持 Unicode 的程序中打开, 你可以选择与目标程序的编码标准相匹配的编码标准。例如, Unicode 允许你在英语语言系统上创建繁体中文文档。但是, 如果文档将在不支持 Unicode 的繁体中文语言程序中打开, 则可以使用繁体中文 (Big5) 编码保存文档。当在繁体中文程序中打开文档时, 所有文本都将正确显示。

注意: 由于 Unicode 是最全面的标准, 因此以任何其他编码保存文本可能会导致一些不能再显示的字符。例如, 使用 Unicode 编码的文档中可以包含希伯来语和西里尔文文本。如果此文档以西里尔文 (windows) 编码保存, 则不能再显示希伯来语文本; 如果文档是用希伯来语 (Windows) 编码保存的, 则不能再显示西里尔文文本。

如果你选择的编码标准不支持文件中使用的字符, Word 会将其不能保存的字符标记为红色。在保存文件之前, 您可以预览所选编码标准中的文本。

当您将文件另存为编码文本时, 将从文件中删除在 "符号字体" 或 "域代码" 中设置格式的文本。

选择编码标准

  1. 单击“文件”选项卡。

  2. 单击“另存为”。

    如果要将文件保存到其他文件夹中, 请找到并打开该文件夹。

  3. 在“文件名”框中,键入文件的新名称。

  4. 在 "保存类型" 框中, 选择 "纯文本"。

  5. 单击“保存”。

  6. 如果出现 " Microsoft Office Word 兼容性检查器" 对话框, 请单击 "继续"。

  7. 在 "文件转换" 对话框中, 选择要使用的编码标准的选项:

    • 若要使用系统的默认编码标准, 请单击 " Windows (默认)"。

    • 若要使用 ms-dos 编码标准, 请单击 " ms-dos"。

    • 若要选择特定的编码标准, 请单击 "其他编码", 然后从列表中选择所需的编码标准。你可以在预览区域中预览文本, 以检查是否可在所选编码标准中阅读所有文本。

      注意: 您可以调整 "文件转换" 对话框的大小, 以便您可以预览更多文档。

  8. 如果您收到一条消息, 指出: "用红色标记的文本在所选编码中无法正确保存", 您可以尝试选择其他编码, 也可以选中 "允许字符替换" 复选框。

    当你允许字符替换时, Word 会将无法显示的字符替换为你所选择的编码中最接近的等效字符。例如, 三个点替换省略号, 而直引号替换为弯引号。

    如果你选择的编码对于标有红色的字符没有等效字符, 则标有红色的字符将被保存为超出上下文字符, 例如问号。

  9. 如果要在不将文本从一行换行的程序中打开文档, 您可以通过选中 "插入换行符" 复选框, 然后指定是否希望换行来表示换行符, 从而在文档中包含硬换行符。 在 "结束行" 框中的回车符 (CR)、换行 (LF) 或两者。

返回首页

查找 Word 中可用的编码标准

Word 识别多种编码标准, 并且它支持您的计算机上的系统软件提供的编码标准。

下面的书写体系列表显示了与每个书写体系相关联的编码标准 (也称为代码页)。

书写系统

编码标准

应用的字体

语言

Unicode (UCS-2 个小字节序和大字节序、utf-8、utf-7)

基于 Word 语言版本的 "常规" 样式的默认字体

阿拉伯语

Windows 1256, ASMO 708

Courier New

简体中文

GB2312、GBK、EUC-CN、ISO-2022-CN、HZ

SimSun

繁体中文

BIG5, EUC-幼圆, ISO-2022-幼圆

MingLiU

斯拉夫

Windows 1251、KOI8、KOI8、ISO8859、5、DOS 866

Courier New

英语、西欧或其他拉丁语脚本

Windows 1250、1252-1254、1257、ISO8859-x

Courier New

希腊语

Windows 1253

Courier New

希伯来语

Windows 1255

Courier New

日语

Shift-JIS, ISO-2022-jp (JIS), EUC-JP

MS Mincho

韩语

Wansung、Johab、ISO-2022-kr、EUC-KR

Malgun Gothic

泰语

Windows 874

yahei

越南语

Windows 1258

Courier New

印度语: 泰米尔语

ISCII 57004

Latha

印度语: 尼泊尔语

ISCII 57002 (梵文)

Mangal

印度语: 孔卡尼语

ISCII 57002 (梵文)

Mangal

印度语: 印地语

ISCII 57002 (梵文)

Mangal

印度语: 阿萨姆语

ISCII 57006

印度语: 孟加拉语

ISCII 57003

印度语: 古吉拉特语

ISCII 57010

印度语: 埃纳德语

ISCII 57008

印度语: 德拉德

ISCII 57009

印度语: 奥利雅文

ISCII 57007

印度语: 马拉地语

ISCII 57002 (梵文)

印度语: 旁遮普语

ISCII 57011

印度语: 梵语

ISCII 57002 (梵文)

印度语: 泰卢固语

ISCII 57005

  • 印度语言的使用要求提供系统支持和适当的 OpenType 字体。

  • 仅对尼泊尔语、阿萨姆语、孟加拉语、古吉拉特语、马拉雅拉姆语和奥利雅文提供有限支持。

返回页首

扩展你的 Office 技能
了解培训
抢先获得新功能
加入 Office 预览体验计划

此信息是否有帮助?

谢谢您的反馈!

谢谢你的反馈! 可能需要转接到 Office 支持专员。

×