FAQ: Как подружить TextEdit с текстовыми файлами, созданными в Windows. Какая кодировка открывает файлы CSV правильно с помощью Excel на Mac и Windows? UPD: Замечательное дополнение от нашего читателя

Чувствую, много ещё будет постов с лейтмотивом "наши на Луне высадились", потому что, как те мыши, продолжаю осваивать кактус. А кактус хоть и похож на яблоко, и пахнет как яблоко, и по сути яблоко, подкидывает столько колючек, что гуглить не перегуглить. Фигурнов там ничего про Mac не издавал? У меня острое дежавю первого знакомства с виндой.

Нынче с русскими именами файлов столкнулся, в полный рост, проблема стародавняя, но я же раньше так плотно на яблоине Mac не сидел.

Суть в чём. Присылает кто-нибудь архив с PC, внутри русские имена файлов или папок, ты его скачиваешь в Safari и получаешь вот такое:

Первая часть проблемы в том, что штатный архиватор русские имена файлов понимает то ли не всегда, то ли никогда. Надо его менять. В Windows всегда ставил WinRAR, это было одним из первых действий после установки, а тут решил остановиться на бесплатном The Unarchiver , он интегрируется в систему и распаковывает всё корректно.

Вторая часть проблемы в том, что Safari, после скачивания, всегда сам архив распаковывал штатным архиватором, тем самым, который ничего не понимает. Лечится входом в настройки Safari и удалением галочки "открывать безопасные файлы после загрузки" (в самом низу):

Установка The Unarchiver проблему не решает, потому что "штатной открывалкой" для ZIP он становится только в Finder, а для Safari тот Finder совсем не авторитет.

Вопрос: есть ли архиватор, побеждающий этот глюк?

А так, всё интуитивно понятно же, для домохозяек-хозяек, но только тех, что с гуглом в голове. Чувствую, нужно как-то себя заставить, сообразно заветам, перестать его использовать таким образом, но как это сделать ума не приложу.

P.S. Ну и, чтобы два раза не вставать, напомню что архивы на iPhone/iPad я распаковываю

На подобную тему, касающийся программного пакета iWork ’09. Пару дней назад я из любопытства установил для пробы новенький Microsoft Office 2011 для Mac, а уже через несколько минут столкнулся с неправильным отображением шрифтов в некоторых текстовых полях. В том числе, и textarea браузера, являющегося для меня одним из основных рабочих инструментов во время написания статей для Маковода. Сегодня я расскажу, в чем заключалась суть и как от неё избавиться.

Начав писать двойную статью про мнения разработчиков о , я заметил, что как-то неправильно и непривычно выглядит семейство шрифтов Georgia, использующееся создателями WordPress для отображения текста в визуальном редакторе (TinyMCE) административной части этой бесплатной CMS. Приглядевшись повнимательней и детально изучив структуру страницы при помощи webkit’овского Веб-инспектора, пришел к выводу, что изменилась высота кириллических символов - они уменьшились!

В качестве примера я взял русскую и латинскую букву «е», имеющую одинаковое начертание и сделал увеличенную выноску. Впрочем, даже без увеличения прекрасно видно, что русские слова выглядят мельче:

Локализовать и устранить данное недоразумение удалось исключительно эмпирическим путем, потому что в интернете найти решение проблемы сразу не получилось, а потом доступ к глобальной сети был оборван зависшим на некоторое время сетевым коммутатором (за что снова огромное спасибо моему провайдеру).

Подобная несправедливость по отношению к русским буквам заключалась в нескольких копиях одного и того же шрифта, который вместе с Word, Excel и прочими «подарками» из Microsoft мне заботливо установил инсталлятор .

Наверное, вы уже в курсе, что у системы для пущей безопасности существует 4 шрифтовых хранилища вместо одного общего, о чем подробней можно прочитать в . Только вот лазить по папкам и удалять вручную все дубликаты нет смысла, раз в Mac OS X предусмотрена специальная утилита для управления шрифтами.

Заходим в приложение Шрифты.app (быстрее всего это можно сделать через Spotlight) и видим желтый треугольник, свидетельствующий о проблеме, описание и даже полезный совет по её решению.

К сожалению, в подсказке не указали месторасположение команды «Устранить дубликаты». Это не страшно - она прячется в меню «Правка» и за один клик позволяет гарантированно отключить все присутствующие в системе дубликаты, пометив их серым цветом в списке.

Откровенно говоря, я точно не знаю, на каком этапе применяются изменения в системе, но мне было достаточно перезапустить Google Chrome и снова наслаждаться одинаковым размером кириллических и латинских букв.

Надеюсь, что такой простой, но эффективный совет поможет и вам!

UPD: Замечательное дополнение от нашего читателя

Спасибо, что подняли эту тему, так как после установки офиса, не все маководы замечают эту проблему, так и живут с кривыми шрифтами.

Но есть еще одна проблема, касается самого офиса. Сам он не учитывает настройки в системе, какие шрифты активные, какие нет, а принудительно использует свои, из каталога /Library/Fonts/Microsoft . В итоге, русского текста в документах либо не будет, либо также будет отображаться другим шрифтом.

Поэтому, лучше всего решить эти проблемы на раз, удалением всех офисных дубликатов, которые не поддерживают русский язык. Вот список дубликатов, без русского и пары устарелых версий, из каталога /Library/Fonts/Microsoft:

  • Andale Mono
  • Arial Black
  • Arial Narrow
  • Arial Rounded Bold
  • Comic Sans MS
  • Georgia
  • Impact
  • Tahoma
  • Trebuchet MS

Можно воспользоваться (). Выполнять необходимо через sudo.

Я нашел кодировку WINDOWS-1252 наименее расстраивающей при работе с Excel. Так как его собственный собственный набор персонажей, основанный на Microsoft, можно предположить, что он будет работать как на Mac, так и на Windows-версии MS-Excel. Обе версии, по крайней мере, включают в себя соответствующий селектор "File origin" или "File encoding", который правильно считывает данные.

В зависимости от вашей системы и используемых вами инструментов эта кодировка также может быть названа CP1252 , ANSI , Windows (ANSI) , MS-ANSI или просто Windows среди других вариантов.

Эта кодировка представляет собой надмножество ISO-8859-1 (aka LATIN1 и другие), поэтому вы можете вернуться к ISO-8859-1 , если по какой-то причине вы не можете использовать WINDOWS-1252 . Имейте в виду, что ISO-8859-1 отсутствует некоторые символы из WINDOWS-1252 , как показано ниже:

| Char | ANSI | Unicode | ANSI Hex | Unicode Hex | HTML entity | Unicode Name | Unicode Range | | € | 128 | 8364 | 0x80 | U+20AC | € | euro sign | Currency Symbols | | ‚ | 130 | 8218 | 0x82 | U+201A | ‚ | single low-9 quotation mark | General Punctuation | | ƒ | 131 | 402 | 0x83 | U+0192 | ƒ | Latin small letter f with hook | Latin Extended-B | | „ | 132 | 8222 | 0x84 | U+201E | „ | double low-9 quotation mark | General Punctuation | | … | 133 | 8230 | 0x85 | U+2026 | … | horizontal ellipsis | General Punctuation | | † | 134 | 8224 | 0x86 | U+2020 | † | dagger | General Punctuation | | ‡ | 135 | 8225 | 0x87 | U+2021 | ‡ | double dagger | General Punctuation | | ˆ | 136 | 710 | 0x88 | U+02C6 | ˆ | modifier letter circumflex accent | Spacing Modifier Letters | | ‰ | 137 | 8240 | 0x89 | U+2030 | ‰ | per mille sign | General Punctuation | | Š | 138 | 352 | 0x8A | U+0160 | Š | Latin capital letter S with caron | Latin Extended-A | | ‹ | 139 | 8249 | 0x8B | U+2039 | ‹ | single left-pointing angle quotation mark | General Punctuation | | Œ | 140 | 338 | 0x8C | U+0152 | Œ | Latin capital ligature OE | Latin Extended-A | | Ž | 142 | 381 | 0x8E | U+017D | | Latin capital letter Z with caron | Latin Extended-A | | ‘ | 145 | 8216 | 0x91 | U+2018 | ‘ | left single quotation mark | General Punctuation | | ’ | 146 | 8217 | 0x92 | U+2019 | ’ | right single quotation mark | General Punctuation | | " | 147 | 8220 | 0x93 | U+201C | “ | left double quotation mark | General Punctuation | | " | 148 | 8221 | 0x94 | U+201D | ” | right double quotation mark | General Punctuation | | | 149 | 8226 | 0x95 | U+2022 | . | bullet | General Punctuation | | – | 150 | 8211 | 0x96 | U+2013 | - | en dash | General Punctuation | | - | 151 | 8212 | 0x97 | U+2014 | — | em dash | General Punctuation | | ˜ | 152 | 732 | 0x98 | U+02DC | ˜ | small tilde | Spacing Modifier Letters | | ™ | 153 | 8482 | 0x99 | U+2122 | ™ | trade mark sign | Letterlike Symbols | | š | 154 | 353 | 0x9A | U+0161 | š | Latin small letter s with caron | Latin Extended-A | | › | 155 | 8250 | 0x9B | U+203A | › | single right-pointing angle quotation mark | General Punctuation | | œ | 156 | 339 | 0x9C | U+0153 | œ | Latin small ligature oe | Latin Extended-A | | ž | 158 | 382 | 0x9E | U+017E | | Latin small letter z with caron | Latin Extended-A | | Ÿ | 159 | 376 | 0x9F | U+0178 | Ÿ | Latin capital letter Y with diaeresis | Latin Extended-A |

Обратите внимание, что знак евро отсутствует . Эту таблицу можно найти в Алан Вуд .

Конверсия

Конверсия выполняется по-разному в каждом инструменте и языке. Однако предположим, что у вас есть файл query_result.csv , который, как вы знаете, закодирован UTF-8 . Преобразуйте его в WINDOWS-1252 с помощью iconv:

Iconv -f UTF-8 -t WINDOWS-1252 query_result.csv > query_result-win.csv

Если вы хотите увидеть на нашем сайте ответы на интересующие вас вопросы обо всём, что связано с техникой Apple, операционной системой Mac OS X (и её запуском на PC), пишите нам через или .

К нам поступил следующий вопрос:

недавно купил себе iMac, я новичок в мире Маков, так что извините за глупый вопрос. всё замечательно, но жутко раздражает, что MacOS не умеет нормально открывать текстовые файлы на русском. всегда какие-то закорюки показывает. как это можно исправить? или в какой-то другой программе открывать надо?

Этот вопрос, пожалуй, нужно включать в инструкцию к каждому новому Маку, продаваемому в России. Действительно, то ли по недосмотру, то ли от лени разработчиков Mac OS X встроенный в систему текстовый редактор TextEdit не умеет работать с русскими кодировками текста. Из-за этого все текстовый файлы txt, созданные или отредактированные в Windows, на Маках выглядят совершенно нечитаемыми.

К счастью, проблема поправима — достаточно лишь заглянуть в настройки TextEdit. Зайдите на вторую их вкладку, которая называется «Открытие и сохранение» :

Нас интересует выпадающий список «Открытие файлов». Как видите, по умолчанию здесь выбран пункт «Автоматически» , и зря. Более того, если посмотреть на содержимое списка, там вы не увидите Windows-кодировок вообще. Но это не значит, что их туда нельзя добавить. В выпадающем списке выберите самый нижний пункт — «Настроить список кодировок» . Откроется ещё одно окошко:

Пометьте в нём галочками пункты «Кириллическая (Windows)» и «Кириллическая (KOI8-R)» . Можно заодно выбрать и все остальные русские и кириллические кодировки. После этого есть шанс, что TextEdit заработает нормально. Если нет, то в уже упомянутом списке «Открытие файлов» вместо «Автоматически» выберите «Кириллическая (Windows)» . Тогда проблемы с русскими текстами точно исчезнут.

Похожие публикации