Выбор кодировки текста при открытии и сохранении файлов

Как правило, при совместной работе с текстовыми файлами нет необходимости вникать в технические аспекты хранения текста. Однако если необходимо передать файл человеку, который работает с текстами на других языках, загрузить текстовый файл из Интернета или открыть его на компьютере с другой операционной системой, может потребоваться задать кодировку при его открытии или сохранении.

Когда пользователь открывает текстовый файл в приложении Microsoft Word или другой программе (например, на компьютере, язык операционной системы на котором отличается от того, на котором написан текст в файле), кодировка помогает программе определить, в каком виде нужно вывести текст на экран, чтобы его можно было прочитать.

Предполагаемое действие

Общие сведения о кодировке текста

Различные кодировки для разных алфавитов

Юникод: одна кодировка для разных алфавитов

Выбор кодировки при открытии файла

Выбор кодировки при сохранении файла

Выбор кодировки

Поиск доступных кодировок в приложении Word

Общие сведения о кодировке текста

Информация, которая выводится на экран в виде текста, на самом деле хранится в текстовом файле в виде числовых значений. Компьютер преобразует эти значения в отображаемые знаки, используя кодировку.

Кодировка — это схема нумерации, согласно которой каждому текстовому символу в наборе соответствует определенное числовое значение. Кодировка может содержать буквенные знаки, цифры и другие символы. В различных языках часто используются разные наборы символов, поэтому многие из существующих кодировок предназначены для отображения наборов символов соответствующих языков.

Различные кодировки для разных алфавитов

Сведения о кодировке, сохраняемые с текстовым файлом, используются компьютером для вывода текста на экран. Например, в кодировке "Кириллица (Windows)" знаку "Й" соответствует числовое значение 201. Когда пользователь открывает файл, содержащий этот знак, на компьютере, на котором используется кодировка "Кириллица (Windows)", компьютер считывает число 201 и выводит на экран знак "Й".

Однако если тот же файл открыть на компьютере, на котором используется другая кодировка, на экран будет выведен знак, соответствующий числу 201 в кодировке по умолчанию. Например, если на компьютере используется кодировка "Западноевропейская (Windows)", знак "Й" из исходного текстового файла на основе кириллицы будет отображен как "É", поскольку именно этому знаку соответствует число 201 в данной кодировке.

Юникод: одна кодировка для разных алфавитов

Чтобы избежать проблем с кодированием и декодированием текстовых файлов, можно сохранять их в Юникоде. В состав этой кодировки входит большинство знаков из всех языков, которые обычно используются на современных компьютерах.

Поскольку приложение Word работает на базе Юникода, все файлы в нем автоматически сохраняются в этой кодировке. Файлы в Юникоде можно открывать на любом компьютере с операционной системой на английском языке независимо от языка текста. Кроме того, на таком компьютере можно сохранять в Юникоде файлы, содержащие знаки, которых нет в западноевропейских алфавитах (например, греческие, кириллические, арабские или японские).

В начало страницы

Выбор кодировки при открытии файла

Если текст в открытом файле отображается в искаженном виде, с вопросительными знаками или квадратами, возможно, приложению Word не удалось правильно определить его кодировку. Чтобы устранить эту проблему, можно указать кодировку для отображения (декодирования) текста.

  1. Откройте вкладку Файл.

  2. Выберите команду Параметры.

  3. Выберите пункт Дополнительно.

  4. Перейдите к разделу Общие и установите флажокПодтверждать преобразование формата файла при открытии.

    Примечание   Когда установлен этот флажок, каждый раз при открытии файла в формате, отличном от формата Word (к числу форматов Word относятся DOC-, DOT-, DOCX-, DOCM-, DOTX- и DOTM-файлы), появляется диалоговое окно Преобразование файла. Если приходится часто работать с такими файлами, но при этом не требуется выбирать кодировку каждый раз, снимите этот флажок, чтобы соответствующее диалоговое окно не отображалось.

  5. Закройте и снова откройте файл.

  6. В диалоговом окне Преобразование файла выберите пункт Кодированный текст.

  7. В диалоговом окне Преобразование файла установите переключатель Другая: и выберите нужную кодировку из списка.

    В области Образец: можно просмотреть текст и проверить, можно ли его прочитать в выбранной кодировке.

Если почти весь текст выглядит одинаково (например, в виде квадратов или точек), возможно, на компьютере не установлен соответствующий шрифт. Если он недоступен, можно установить дополнительные шрифты.

Чтобы установить дополнительные шрифты, выполните указанные ниже действия.

  1. В операционной системе Microsoft Windows нажмите кнопку Пуск и выберите пункт Панель управления.

  2. Выполните одно из указанных ниже действий.

    В Windows 7

    1. На панели управления выберите элемент Удаление программ.

    2. В списке программ щелкните список для Microsoft Office или Microsoft Word, в зависимости от того, как был установлен Word — как часть Office или как отдельная программа, и нажмите кнопку Изменить.

    В Windows Vista

    1. На панели управления выберите элемент Удаление программ.

    2. В списке программ щелкните список для Microsoft Office или Microsoft Word, в зависимости от того, как был установлен Word — как часть Office или как отдельная программа, и нажмите кнопку Изменить.

    В Microsoft Windows XP

    1. На панели управления выберите элемент Установка и удаление программ.

    2. В поле Установленные программы щелкните список для Microsoft Office или Microsoft Word, в зависимости от того, как был установлен Word — как часть Office или как отдельная программа, и нажмите кнопку Изменить.

  3. В разделе Изменение установки Microsoft Office нажмите кнопку Добавить или удалить компоненты, а затем — кнопку Продолжить.

  4. В разделе Параметры установки разверните элемент Общие средства Office, а затем — Многоязыковая поддержка.

  5. Выберите нужный шрифт, щелкните стрелку рядом с ним и выберите пункт Запускать с моего компьютера.

Совет   При открытии текстового файла в той или иной кодировке в приложении Word используются шрифты, определенные в диалоговом окне Параметры веб-документа. (Чтобы вызвать диалоговое окно Параметры веб-документа, нажмите кнопку Microsoft Office, затем — кнопку Параметры Word, и выберите категорию Дополнительно. В разделе Общие нажмите кнопку Параметры веб-документа.) С помощью параметров на вкладке Шрифты диалогового окна Параметры веб-документа можно настроить шрифт для каждой кодировки.

В начало страницы

Выбор кодировки при сохранении файла

Если при сохранении файла в приложении Word не указать кодировку, он будет сохранен в Юникоде. Как правило, кодировки Юникод вполне достаточно, поскольку она поддерживает большинство знаков из большинства языков.

Если документ планируется открывать в программе, которая не поддерживает Юникод, можно выбрать нужную кодировку. Например, в операционной системе на английском языке можно создать документ на традиционном китайском с использованием Юникода. Однако если такой документ будет открываться в программе, которая поддерживает китайский язык, но не поддерживает Юникод, файл можно сохранить в кодировке "Китайская традиционная (Big5)". В результате текст будет отображен правильно при открытии документа в программе, поддерживающей китайский язык (традиционное письмо).

Примечание   Поскольку Юникод — это наиболее полный стандарт, при сохранении текста в других кодировках некоторые знаки могут не отображаться. Предположим, что документ в Юникоде содержит текст на иврите и языке с кириллическим алфавитом. Если сохранить файл в кодировке "Кириллица (Windows)", текст на иврите не отобразится, а если сохранить его в кодировке "Иврит (Windows)", то не будет отображаться кириллический текст.

Если выбрать кодировку, которая не поддерживает используемые в файле символы, то те знаки, которые невозможно сохранить, будут помечены красным цветом . Перед сохранением файла можно просмотреть его текст в выбранной кодировке.

При сохранении файла в виде кодированного текста из него удаляется текст, для которого выбран шрифт "Символы", а также коды полей.

Выбор кодировки

  1. Откройте вкладку Файл.

  2. Выберите пункт Сохранить как.

    Если требуется сохранить файл в другой папке, найдите и откройте ее.

  3. В поле Имя файла введите новое имя файла.

  4. В поле Тип файла выберите пункт Обычный текст.

  5. Нажмите кнопку Сохранить.

  6. Если появится диалоговое окно Microsoft Office Word — проверка совместимости, нажмите кнопку Продолжить.

  7. В диалоговом окне Преобразование файла выберите подходящую кодировку.

    • Чтобы использовать кодировку системы по умолчанию, установите переключатель Windows (по умолчанию).

    • Чтобы использовать кодировку MS-DOS, установите переключатель MS-DOS.

    • Чтобы задать другую кодировку, установите переключатель Другая: и выберите нужный пункт в списке. В области Образец: можно просмотреть текст и проверить, можно ли его прочитать в выбранной кодировке.

      Примечание   Чтобы увеличить область отображения документа, можно изменить размер диалогового окна Преобразование файла.

  8. Если появилось сообщение "Текст, выделенный красным, невозможно правильно сохранить в выбранной кодировке", можно выбрать другую кодировку или установить флажок Разрешить подстановку знаков.

    Если разрешена подстановка знаков, знаки, которые невозможно отобразить, будут заменены ближайшими эквивалентными символами в выбранной кодировке. Например, многоточие заменяется тремя точками, а угловые кавычки — прямыми.

    Если в выбранной кодировке нет эквивалентных знаков для символов, выделенных красным цветом, они будут сохранены как внеконтекстные (например, в виде вопросительных знаков).

  9. Если документ будет открываться в программе, которая не поддерживает перенос текста на следующую строку, в него можно включить жесткие разрывы строк. Для этого установите флажок Вставлять разрывы строк и укажите в поле Завершать строки:, какие именно символы соответствуют разрыву строки (возврат каретки (CR), перенос строки (LF) или оба).

В начало страницы

Поиск доступных кодировок в приложении Word

В приложении Word распознаются различные кодировки, в том числе поддерживаемые операционной системой компьютера.

Ниже перечислены системы письма и кодировки (также называемые кодовыми страницами), связанные с каждой из них.

Система письма

Кодировки

Применяемый шрифт

Многоязычная

Юникод (UCS-2 с прямым и обратным порядком байтов, UTF-8, UTF-7)

Шрифт по умолчанию для стиля "Обычный" установленной локализованной версии приложения Word

Арабская

Windows 1256, ASMO 708

Courier New

Китайская упрощенная

GB2312, GBK, EUC-CN, ISO-2022-CN, HZ

SimSun

Китайская традиционная

BIG5, EUC-TW, ISO-2022-TW

MingLiU

Кириллица

Windows 1251, KOI8-R, KOI8-RU, ISO8859-5, DOS 866

Courier New

Английская, западноевропейская и другие, основанные на латинице

Windows 1250, 1252-1254, 1257, ISO8859-x

Courier New

Греческая

Windows 1253

Courier New

Иврит

Windows 1255

Courier New

Японская

Shift-JIS, ISO-2022-JP (JIS), EUC-JP

MS Mincho

Корейская

Wansung, Johab, ISO-2022-KR, EUC-KR

Malgun Gothic

Тайская

Windows 874

Tahoma

Вьетнамская

Windows 1258

Courier New

Индийские: тамильская

ISCII 57004

Latha

Индийские: непали

ISCII 57002 (деванагари)

Mangal

Индийские: конкани

ISCII 57002 (деванагари)

Mangal

Индийские: хинди

ISCII 57002 (деванагари)

Mangal

Индийские: ассамская

ISCII 57006

Индийские: бенгальская

ISCII 57003

Индийские: гуджарати

ISCII 57010

Индийские: каннада

ISCII 57008

Индийские: малаялам

ISCII 57009

Индийские: ория

ISCII 57007

Индийские: маратхи

ISCII 57002 (деванагари)

Индийские: панджаби

ISCII 57011

Индийские: санскрит

ISCII 57002 (деванагари)

Индийские: телугу

ISCII 57005

Примечание   

  • Для использования индийских языков необходима их поддержка в операционной системе и наличие соответствующих шрифтов OpenType.

  • Поддержка языков непали, гуджарати, малаялам, ория, а также ассамского и бенгальского ограничена.

В начало страницы

Применяется к: Word 2010



Были ли сведения полезными?

Да Нет

Что мы могли бы улучшить?

255 осталось символов

Чтобы защитить вашу конфиденциальность, не указывайте контактные данные в своем отзыве. Обзор наших политика конфиденциальности.

Спасибо за ваш отзыв!

Ресурсы поддержки

Изменить язык