Много раз я сталкивался с так называемым « апострофом пишущей машинки » (символ Unicode U+0027
и символ HTML '
) для обозначения апострофа:
Но, с другой стороны, вместо этого также используется « правая одинарная кавычка » (символ Unicode U+2019
и символ HTML ):’
Интересно, какой из них правильный и его следует использовать в типографике?
Примечание. В обоих примерах использовался шрифт без засечек Arial .
Апостроф впервые появился в печатной вселенной в Италии в 16 веке в виде изогнутой формы, обозначающей элизию , скопированную из рукописной классической итальянской поэзии. Апостроф был эквивалентен нашим «Попался» или «Хочу» в том смысле, что это был способ убрать жесткость текста, сделав его более похожим на человеческий.
Вот пример одного из первых случаев, когда апостроф был напечатан. Это из «Le cose volgari di messer Francesco», классического итальянского произведения, написанного Петраркой и опубликованного Альдусом Мануцием в Италии около 1501 года.
Альд Мануций предположительно скопировал эту книгу с оригинальной рукописи Петрарки, принадлежавшей его другу. У него был специальный шрифт, разработанный на основе почерка поэта, создавший наклонный стиль, который мы сегодня знаем как «курсив». Ему пришлось ввести глиф апострофа, чтобы иметь возможность скопировать текст точно так, как его написал поэт. Обратите внимание на апостроф в слове (словах) «l'honorata». Обратите внимание, что он имеет изогнутую форму.
Этот новаторский шрифт «Курсив» и стильный разговорный способ обозначения пропусков в виде симпатичного маленького знака сразу же приобрели известность. Даже когда шрифт был защищен самим Папой Римским, его начали незаконно копировать художники-фальшивомонетчики. Копии книги были напечатаны в Лионе пиратским шрифтом с апострофом и прочим.
В 1501 году Жоффруа Тори опубликовал книгу «Кампофлори», которая произвела революцию во французской грамматике и книгоиздании. Он ввел, среди прочего, апостроф, копируя новый модный итальянский способ считать исключения стильными. Это отрывок из книги. Обратите внимание на изогнутый апостроф.
В том же веке и по тем же причинам английский язык заимствовал апостроф из французского.
Апостроф перестал быть новинкой и стал частью обычной грамматики. В печатных текстах он сохранил свою изогнутую форму. С другой стороны, прямой глиф, похожий на апостроф, имел разные функции, например, обозначал «простой». Однако в рукописных документах иногда это стилизовано под прямую галочку (см. комментарий Йорика ниже).
С изобретением пишущих машинок и клавиатур (1860-е годы) инженеры столкнулись с проблемой размещения множества символов (клавиш) на небольшом пространстве. Им пришла в голову идея объединить похожих персонажей, чтобы сэкономить место. Вместо левых, правых и прямых «апострофов» они решили включить только прямой. Аналогичные решения были приняты и в отношении других символов, распространенных в наборе текста, таких как длинное тире и короткое тире.
https://en.wikipedia.org/wiki/Typewriter#Typewriter_conventions
Этот сокращенный набор символов был закодирован в первом в мире двоичном наборе символов, 5-битном коде Бодо (1870 г.). В набор также входила прямая двойная кавычка в виде одного символа. 7-битный ASCII унаследовал тот же набор символов.
С тех пор весь печатный (и телеграфный) текст оформлялся только прямыми кавычками. Фигурные использовались только в традиционном наборном тексте.
Только с популяризацией текстовых процессоров фигурные апострофы вновь появились в цифровом мире. Такие системы, как Word, предлагали функцию автоматической замены прямого апострофа фигурными кавычками в зависимости от контекста. Однако это был выбор пользователя, и не все текстовые процессоры имели эту функцию. Чтобы добавить путаницы, стандартные клавиатуры не включали фигурные кавычки, поэтому обычному пользователю было очень сложно ввести их намеренно.
Когда был создан Unicode, одним из принципов дизайна было «унифицировать» символы. Символы из разных сценариев или языков, которые выглядели одинаково, должны были быть объединены и упрощены как один. Вы могли бы подумать, что они вернулись бы к происхождению и избавились бы от прямого апострофа. Теперь, к этому моменту, путаница и свободное использование прямых и фигурных апострофов и кавычек были настолько велики, что Unicode решил включить и то, и другое.
Итак, как и сегодня, оба (фигурный и прямой апостроф) принимаются как апостроф и кавычка, но есть некоторые соображения:
Если цель текста состоит в том, чтобы он выглядел так, как если бы он был набран традиционным шрифтом, то всегда используйте фигурные, как это было изначально. Держите прямую, чтобы обозначить простое число.
Использование прямого апострофа и кавычек может быть способом передать цифровое настроение вашего документа, точно так же, как символы одинаковой ширины подразумевают, что текст был напечатан на пишущей машинке или консоли.
Если текст является цифровым и предназначен для восприятия человеческим глазом, оба (фигурный и прямой апостроф) принимаются как апостроф и кавычки. Здесь различаются школы и правила раскола. Продолжаем выразительный беспорядок. Просто будьте последовательны в пределах одного и того же документа.
Если цель текста состоит в том, чтобы быть семантически правильным (как если бы вы хотели, чтобы компьютер мог анализировать семантику текста), вам следует обратить пристальное внимание на определение символов в Unicode. U+0027(тот, который можно набрать с клавиатуры) называется «АПОСТРОП». Хотя это намекает на то, что он может быть хорошим кандидатом для представления апострофов, обратите внимание, что Unicode неоднозначно относится к этому символу, указывая на то, что, по крайней мере, в английском языке U + 2019 является предпочтительным для апострофов. Я лично считаю, что это противоречит их принципу унификации. Вы ожидаете, что апостроф будет одним и тем же независимо от языка, в котором он используется. Добавьте к этому тот факт, что они классифицируют апостроф как «пунктуацию», что во французском языке может быть неловко принято, но в английском не имеет никакого смысла. Таким образом, вы остаетесь в затруднительном положении: либо использовать разные апострофы для разных языков, либо использовать спорный апостроф для английского языка. Обсужденияо том, какой из них правильный, можно очень увлечься. С другой стороны, кажется совершенно очевидным, что U+2019 (и ни в коем случае не прямую) следует использовать в качестве правой кавычки. По той же причине U+2032 следует использовать для обозначения простого числа, а U+02BC следует использовать для обозначения апострофа с буквой-модификатором (например, в гортанной смычке произношения слова кокни слова bu'er или в транскрипции "uh'oh"). ").
Обратите внимание, что даже если вы выберете или наберете правильный символ, используемый вами шрифт может отобразить его фигурным или прямым образом.
'
отличаются от простых чисел ʹ
.Провел небольшое исследование, чтобы убедиться, но в целом «правильная» типографика не использует прямые кавычки, одинарные или двойные. Вот удобное руководство по командам и объектам HTML для одинарных/двойных фигурных кавычек .
Пишущие машинки также несут ответственность за введение «прямых кавычек», неспецифических кавычек, разработанных как мера экономии места для клавиатуры, позволяющая избежать необходимости в отдельных открывающих и закрывающих кавычках. Прямые кавычки обычно используются вместо правильных кавычек или «фигурных кавычек». Многие дизайнеры скажут вам, что прямые кавычки используются для представления футов и дюймов, но на самом деле футы и дюймы должны быть представлены с помощью простых чисел. Прямые кавычки устарели и не должны использоваться.
Комментарии стандарта Unicode к U+2019 (') :
это предпочтительный символ для апострофа
Что касается того, что правильно с точки зрения кодирования, я не могу думать о более высоком авторитете.
Кроме того, типографские соглашения большинства языков не используют U + 2019 для других целей или только как второстепенные кавычки. Фактически, британский английский является единственным основным языком, использующим этот символ в качестве основной кавычки. Таким образом, нет большой необходимости использовать здесь U+0027 (или любой другой символ) для различения.
Типографически существует три подхода к определению того, что является «правильным»:
К чему люди привыкли . В то время как в классическом и профессиональном наборе люди в основном сталкиваются с фигурным апострофом, в цифровых текстах преобладает апостроф пишущей машинки. Здесь нет хорошего ответа.
Что соответствует общему характеру шрифта без значительного ухудшения читабельности — это в некоторой степени зависит от шрифта. Давайте рассмотрим несколько примеров:
Во всех примерах апостроф в слове Don’t — U+2019, а апостроф в amn’t — U+0027. Сначала обратите внимание, как оба символа различаются по шрифтам.
Первый пример — светлый шрифт без засечек. Это далеко не орнамент, и фигурный апостроф был бы неуместен. Следовательно, U+2019 лишь слегка наклонена. Прямая буква U+0027 также хорошо сочетается с простым характером шрифта.
Круглые формы, очевидно, являются основной парадигмой шрифта во втором примере. Следовательно, U+2019 фигурный. U + 0027 разработан, чтобы избежать любого направления (предположительно, чтобы его также можно было использовать в качестве открывающей кавычки) и, следовательно, кривых. Кроме того, он довольно маленький, по-видимому, компромисс между тем, чтобы не нарушать характер шрифта крупными буквами и ухудшать читаемость маленькими буквами. Если вы спросите меня, компромисс слишком незначительный, но это только симптом — реальная проблема заключается в компромиссе, которого можно избежать, используя фигурный апостроф, который намного лучше подходит к шрифту.
В классических шрифтах с засечками, как и в третьем примере, ширина штриха в основном зависит от угла (который берет свое начало в каллиграфии). Прямые вертикальные линии обычно заканчиваются засечками. Это не вариант для апострофа, и, следовательно, U + 0027 использует форму капли и, таким образом, нарушает характер шрифта (на мой взгляд). Правда, то же самое относится и к восклицательному знаку, но, по крайней мере, этот символ все равно будет мешать. Фигурная U+2019, на мой взгляд, намного лучше подходит к характеру шрифта.
Последний шрифт еще более каллиграфичен, но его характер предлагает другой способ оформления чисто вертикальных элементов. Таким образом, U+0027 не так тревожит и не так сильно отличается от U+2019.
Подводя итог этому пункту: это зависит от шрифта, но правильно оформленный U+2019 никогда не должен быть хуже, чем U+0027, даже если последний хорошо разработан. Это неудивительно, потому что шрифтовой дизайнер может более гибко формировать U + 2019, чтобы он соответствовал остальной части шрифта, поскольку симметрия не требуется.
Что лучше для удобочитаемости в долгосрочной перспективе . Использование одного и того же символа для многих целей, возможно, не очень хорошо для удобочитаемости. Таким образом, если мы предположим, что британские соглашения о наборе текста не изменились в остальном, прямой апостроф имеет то преимущество, что его можно отличить от фигурной закрывающей кавычки. Однако это соглашение (используйте U + 0027 для апострофа и U + 2019 для одиночной закрывающей кавычки) еще сложнее установить, чем установить использование фигурных кавычек и апострофов в цифровом мире.
Во многих других языках это не имело бы большого смысла, так как U+2019 в любом случае не используется в качестве кавычки. В таких языках, как немецкий, в котором в качестве кавычки используется перевернутая буква U+2018 (', английская одинарная открывающая кавычка), наличие двух противоположных завитков или наклонов (в зависимости от шрифта) часто способствует лучшему различию — по крайней мере, на мой взгляд. .
U+2019
, не используется для кавычек в немецком языке: „ ...“ С другой стороны, я до сих пор удивляюсь, почему U+2019
на немецко-австрийской клавиатуре нет клавиши.Сначала немного истории .
Фигурные кавычки и апострофы были оригинальным стилем. Их также называют кавычками и апострофами принтера .
Прямые кавычки и апострофы пришли вместе с пишущей машинкой. Пишущая машинка, будучи механическим устройством с ограничениями, решила, что более целесообразно использовать один набор прямых знаков вместо двух отдельных наборов фигурных знаков (для открывающих и закрывающих одинарных и двойных кавычек).
Чтобы добавить еще больше путаницы, Простые числа также являются символом, который выглядит как угловой прямой апостроф. Штрихи используются для обозначения минут/секунд (а также других научных, математических и музыкальных обозначений). Опять же, для них также можно было использовать прямые апострофы пишущей машинки.
Тем не менее, некоторые шрифты разработаны только с прямыми апострофами и кавычками по стилистическим причинам.
Подводя итог: всегда используйте фигурную версию для фактических кавычек и апострофов, если только вы: а) не используете пишущую машинку 1954 года или б) у вас есть стилистические причины для использования прямых.
Есть один пункт, который до сих пор не упоминался во всех ответах. В интерфейсе командной строки или на языке программирования апостроф (символ UTF-8 27) является единственным допустимым выбором.
Использование U+2019 вызывает синтаксические ошибки при вырезании и вставке. С автоматическим переводом символа 27 в U + 2019 теперь это означает, что копирование командных строк из документов Word (или некоторых вики / веб-страниц) будет вызывать ошибки, которые заставят многих людей запутаться, пока эта проблема не будет указана. Это также может вызвать ошибки компилятора/интерпретатора, которые не имеют смысла.
При написании технических документов с примерами кода и/или командной строки убедитесь, что все созданные образцы используют символ 27, а не более высокое значение.
'a'
это односимвольный литерал «a». (Это отличается от строки, содержащей только букву a
, в которой используется U+0022: "a"
это строка, содержащая только букву «a».) Некоторые языки, такие как Javascript, позволяют взаимозаменяемо использовать одинарные и двойные кавычки (но у вас есть выбрать любой из них для конкретной строки). Другие языки (такие как Pascal, Ada, SQL) используют U+0027 для обозначения строковых литералов: в SQL 'a'
это строка, содержащая только букву «a»."
и '
одном так или иначе.`
, U+0060
) используется, например, в оболочках UNIX для обозначения подстановки команд.Я работаю в исследовательском центре, и мы обычно используем довольно большие французские и немецкие корпуса (довольно свежие). Во французском корпусе прямой апостроф «появляется примерно в 4 раза чаще, чем фигурный апостроф». В немецком «прямой» не существует, и можно найти только кудрявый. Различия во французском корпусе на самом деле могут быть связаны с тем, что прямые буквы обычно используются в печатных текстах, а изогнутые — в основном из текстов копирования / вставки, которые размещаются в Интернете. С другой стороны, немецкие источники, по-видимому, используют исключительно фигурное «. Следует также учитывать тот факт, что апостроф гораздо чаще встречается во французском языке, чем в немецком.
Правильным символом для размещения в опубликованном тексте в качестве апострофа является символ UTF-8 U+2019 , правильная одинарная кавычка. Это единственный символ, который даст вам желаемый результат, который представляет собой типографский апостроф книжного уровня. Когда вы используете инструмент для письма, который делает «умные кавычки», и вы нажимаете клавишу апострофа, инструмент вставит символ UTF-8 2019.
Апостроф буквы модификатора U+02BC символа UTF-8 — это крошечный апостроф для произношения. Это не будет выглядеть правильно в контексте написания «не могу».
Апостроф U+0027 символа UTF-8 — это «апостроф программиста». Он остался с зари вычислительной техники, когда компьютеры имели только 127 символов и были предназначены для написания компьютерных программ, а не для типографики книжного уровня. Первые 127 символов UTF-8 — это те же оригинальные 127 символов, а компьютерная клавиатура практически не изменилась, так что эта плохая типографика живет и живет, и живет.
Причина, по которой эта ошибка продолжает жить, заключается в том, что люди, унаследовавшие компьютерное наследие, не обязательно считают апострофы программистов ошибками. Люди, которые пришли из издательского наследия, делают это. Но именно компьютерщики проектируют компьютеры. Это не является оправданием для неправильных типографик в опубликованном тексте. Сегодня у нас есть замена текста, и у нас есть много способов обойти это.
В идеале писатели должны использовать инструменты, которые не позволяют им вводить апострофы программиста, потому что они просто добавляют ошибку в свою рукопись UTF-8. Конечно, редакторы это исправят, но подход «исправить потом» часто приводит к публикации ошибок.
Поэтому, если у вас есть рукопись любого рода — книга, рассказ, статья — и в ней есть программистские апострофы, вы должны заменить их символом UTF-8 2019 перед публикацией.
То же самое касается котировок программиста. Хорошие инструменты письма не должны позволять писателю печатать их, они должны печатать правильные кавычки, особенно потому, что их труднее исправить при редактировании, и это приводит к еще худшей читаемости, если они не фиксированы, по сравнению с апострофами.
В качестве примера инструмента для письма вы можете посмотреть на BBEdit, текстовый редактор, который десятилетиями использовался на Mac. Если вы создадите программный документ (HTML или другой язык) и нажмете клавишу апострофа, вы получите апостроф программиста. Если вы создадите письменный документ (обычный текст или Markdown) и нажмете клавишу апострофа, вы получите символ UTF-8 2019. То же самое касается кавычек. В документах по программированию вы получаете кавычки программиста. При написании документов вы получаете настоящие кавычки, как открывающие, так и закрывающие кавычки при вводе. Это лучший способ заключать кавычки, потому что инструмент может делать правильные открытые и закрытые кавычки, когда автор пишет. Во-первых, здесь не содержится никакой двусмысленности, поэтому ее нужно исправить позже (или нет).
пользователь 2284570
Мартин Заске