在打开和保存文件时选择文本编码

通常,你可以共享文本文件,而无需担心存储文本的基本细节。 但是,如果与使用其他语言的用户共享文本文件、通过 Internet 下载文本文件或与其他计算机系统共享文本文件,可能需要在打开或保存文件时选择编码标准。

当您或其他人在 Microsoft Word 或其他程序中打开文本文件时(可能是计算机的系统软件的语言不同于创建文件时所用的语言)时,编码标准可帮助该程序确定如何表示文本,使其可读。

您要做什么?

了解文本编码

在打开文件时选择编码标准

在保存文件时选择编码标准

查找 Word 中可用的编码标准

了解文本编码

作为文本显示在屏幕上的文本实际上存储为文本文件中的数字值。 计算机将数值转换为可见字符。 它通过使用编码标准执行此操作。

编码标准是一种编号方案,用于将字符集中的每个文本字符分配给一个数值。 字符集可以包含字母字符、数字和其他符号。 不同的语言通常由不同的字符集组成,因此存在许多不同的编码标准来表示在不同语言中使用的字符集。

不同字母表的不同编码标准

与文本文件一起保存的编码标准提供了计算机在屏幕上显示文本所需的信息。 例如,在西里尔文(Windows)编码中,字符Й的数值为201。 当您在使用西里尔(Windows)编码的计算机上打开包含此字符的文件时,计算机将读取201数值并在屏幕上显示Й。

但是,如果在使用不同编码的计算机上打开同一文件,计算机将显示与默认情况下计算机使用的编码标准中的201数值相对应的任何字符。 例如,如果你的计算机使用西欧(Windows)编码标准,则原始基于西里尔文的文件中的字符将显示为É而不是Й,因为在西欧(Windows)编码中,值201映射到É。

Unicode:许多字母的一个编码标准

若要避免编码和解码文本文件的问题,您可以用 Unicode 编码保存文件。 Unicode 可容纳大多数在计算机用户的常用语言中的大多数字符集。

由于 Word 基于 Unicode,Word 会自动保存编码为 Unicode 的文件。 无论文本的语言如何,您都可以在英语语言的计算机系统上打开和读取 Unicode 编码的文件。 同样,当你使用英语语言系统保存编码为 Unicode 的文件时,该文件可以包含在西欧字母(如希腊语、西里尔文、阿拉伯语或日语字符)中找不到的字符。

返回页首

在打开文件时选择编码标准

如果在打开文件时,文本出现乱码或问号或方框,则 Word 可能未正确检测到文件中文本的编码标准。 你可以指定可用于显示(解码)文本的编码标准。

  1. 单击“文件”选项卡。

  2. 单击“选项”

  3. 单击“高级”。

  4. 滚动到 "常规" 部分,然后选中 "打开时确认文件格式转换" 复选框。

    注意: 如果选中此复选框,则每次以非 Word 格式打开文件时,Word 将显示 "转换文件" 对话框(word 格式包括 .doc、.dot、.docx、.docm、building blocks.dotx 或 normal.dotm 文件)。 如果你经常处理此类文件,但很少希望选择编码标准,请记住关闭此选项,以防止不必要地打开此对话框。

  5. 关闭文件,然后重新打开。

  6. 在 "转换文件" 对话框中,选择 "编码文本"。

  7. 在 "文件转换" 对话框中,选择 "其他编码",然后从列表中选择所需的编码标准。

    你可以预览预览区域中的文本,以检查是否所有文本均可在所选编码标准中阅读。

如果几乎所有文本看起来相同(例如,所有框或所有点),则可能不会安装显示字符所需的字体。 如果所需字体不可用,则可以安装其他字体。

若要安装其他字体,请执行下列操作:

  1. 在 Microsoft Windows 中,单击“开始”按钮,然后单击“控制面板”

  2. 执行下列操作之一:

    在 Windows 7 中

    1. 在 "控制面板" 中,单击 "卸载程序"。

    2. 在程序列表中,单击 "Microsoft Office" 或 "Microsoft Word" 的列表,具体取决于你是将 Word 作为 Office 的一部分还是作为单个程序安装的,然后单击 "更改"。

    在 Windows Vista 中

    1. 在 "控制面板" 中,单击 "卸载程序"。

    2. 在程序列表中,单击 "Microsoft Office" 或 "Microsoft Word" 的列表,具体取决于你是将 Word 作为 Office 的一部分还是作为单个程序安装的,然后单击 "更改"。

    在 Microsoft Windows XP 中

    1. 在 "控制面板" 中,单击 "添加或删除程序"。

    2. 在 "当前安装的程序" 框中,单击 "microsoft Office" 或 "microsoft Word" 列表,具体取决于你是将 Word 安装为 Office 的一部分还是作为单个程序,然后单击 "更改"。

  3. 在 "更改 Microsoft Office 安装" 下,单击 "添加或删除功能",然后单击 "继续"。

  4. 在 "安装选项" 下,展开 " Office 共享功能",然后展开 "国际支持"。

  5. 选择所需的字体集,单击所选内容旁边的箭头,然后选择 "从本机运行"。

提示: 打开编码的文本文件时,Word 会应用 " Web 选项" 对话框中定义的字体。 (若要访问 " Web 选项" 对话框,请单击 " Microsoft Office 按钮",单击 " Word 选项",然后单击 "高级"。 在 "常规" 部分中,单击 " Web 选项"。 可以在 " Web 选项" 对话框中选择 "字体" 选项卡上的选项来自定义每个字符集的字体。

返回页首

在保存文件时选择编码标准

如果您在保存文件时没有选择编码标准,Word 会将文件编码为 Unicode。 通常,你可以使用默认的 Unicode 编码,因为它支持大多数语言中的大多数字符。

如果你的文档将在不支持 Unicode 的程序中打开,你可以选择与目标程序的编码标准相匹配的编码标准。 例如,Unicode 使你能够在英语语言系统上创建繁体中文文档。 但是,如果文档将在不支持 Unicode 的繁体中文程序中打开,则可以将文档保存为繁体中文(Big5)编码。 在繁体中文程序中打开文档时,将正确显示所有文本。

注意: 由于 Unicode 是最全面的标准,因此以任何其他编码保存文本可能会导致某些不能再显示的字符。 例如,以 Unicode 编码的文档可以包含希伯来语和西里尔文文本。 如果此文档保存有西里尔文(Windows)编码,则不能再显示希伯来语文本,并且如果文档以希伯来语(Windows)编码保存,则不能再显示西里尔文文本。

如果您选择的编码标准不支持您在文件中使用的字符,Word 将以红色标记它无法保存的字符。 你可以在保存文件之前按所选编码标准预览文本。

将文件保存为编码文本时,将从文件中删除在 "符号字体" 或 "域代码" 中设置格式的文本。

选择编码标准

  1. 单击“文件”选项卡。

  2. 单击“另存为”

    如果要将文件保存在其他文件夹中,请找到并打开该文件夹。

  3. 在“文件名”框中,键入文件的新名称。

  4. 在 "保存类型" 框中,选择 "纯文本"。

  5. 单击“保存”

  6. 如果出现 " Microsoft Office Word 兼容性检查器" 对话框,请单击 "继续"。

  7. 在 "文件转换" 对话框中,选择要使用的编码标准的选项:

    • 若要使用系统的默认编码标准,请单击 " Windows (默认)"。

    • 若要使用 MS-DOS 编码标准,请单击 " ms-dos"。

    • 若要选择特定的编码标准,请单击 "其他编码",然后从列表中选择所需的编码标准。 你可以预览预览区域中的文本,以检查是否所有文本均可在所选编码标准中阅读。

      注意: 你可以调整 "文件转换" 对话框的大小,以便可以预览更多文档。

  8. 如果收到一条消息,显示 "以红色标出的文本将无法正确保存在所选编码" 中,您可以尝试选择不同的编码,也可以选中 "允许字符替换" 复选框。

    如果允许字符替换,Word 将使用所选编码中最接近的等效字符替换无法显示的字符。 例如,三个圆点替换省略号,而直引号则替换弯引号。

    如果所选编码对于标有红色的字符没有等效字符,则标记为红色的字符将保存为超出上下文字符,例如问号。

  9. 如果在不将文本从一行换行的程序中打开文档,则可以在文档中包含硬换行符,方法是选中 "插入换行符" 复选框,然后指定是否希望使用回车符(CR)、换行符(LF)或同时在 "结束行" 框中指定换行符。

返回页首

查找 Word 中可用的编码标准

Word 识别多个编码标准,并且它支持您的计算机上的系统软件所提供的编码标准。

以下写入系统列表显示了与每个书写系统相关联的编码标准(也称为代码页)。

书写系统

编码标准

应用的字体

多种

Unicode (UCS-2 个小字节序和大字节序、UTF-8、UTF-7)

基于 Word 语言版本的 "正文" 样式的默认字体

阿拉伯语

Windows 1256,ASMO 708

Courier New

简体中文

GB2312、GBK、EUC-CN、ISO-2022-CN、HZ

新宋体

繁体中文

BIG5,EUC-幼圆,ISO-2022

MingLiU

Windows 1251、KOI8、KOI8、ISO8859、DOS 866

Courier New

英语、西欧或其他拉丁语脚本

Windows 1250、1252-1254、1257、ISO8859-x

Courier New

希腊语

Windows 1253

Courier New

希伯来语

Windows 1255

Courier New

日语

Shift-jis,ISO-2022 (JIS),EUC-JP

MS Mincho

韩语

Wansung、Johab、ISO-2022-kr、EUC-KR

雅 Mt

泰语

Windows 874

Tahoma

越南语

Windows 1258

Courier New

印度语:泰米尔语

ISCII 57004

Latha

印度语:尼泊尔语

ISCII 57002 (梵文)

Mangal

印度语:孔卡尼语

ISCII 57002 (梵文)

Mangal

印度语:印地语

ISCII 57002 (梵文)

Mangal

印度语:阿萨姆语

ISCII 57006

印度语:孟加拉语

ISCII 57003

印度语:古吉拉特语

ISCII 57010

印度语:埃纳德文

ISCII 57008

印度语:马拉雅拉姆语

ISCII 57009

印度语:奥里雅语

ISCII 57007

印度语:马拉地语

ISCII 57002 (梵文)

印度语:旁遮普语

ISCII 57011

印度语:梵语

ISCII 57002 (梵文)

印度语:泰卢固语

ISCII 57005

  • 使用印度语言需要系统支持和相应的 OpenType 字体。

  • 仅为尼泊尔语、阿萨姆语、孟加拉语、古吉拉特语、马拉雅拉姆语和奥里雅语提供有限支持

返回页首

扩展你的 Office 技能
了解培训
抢先获得新功能
加入 Office 预览体验计划

此信息是否有帮助?

谢谢您的反馈!

谢谢你的反馈! 可能需要转接到 Office 支持专员。

×