Какой символ подходит для апострофа?

Много раз я сталкивался с так называемым « апострофом пишущей машинки » (символ Unicode U+0027и символ HTML ') для обозначения апострофа:

апостроф пишущей машинки

Но, с другой стороны, вместо этого также используется « правая одинарная кавычка » (символ Unicode U+2019и символ HTML ):’

правая одинарная кавычка

Интересно, какой из них правильный и его следует использовать в типографике?

Примечание. В обоих примерах использовался шрифт без засечек Arial .

Если вы хотите писать по-французски, то обязательно используйте второе слово с узким неразрывным пробелом перед вопросительным знаком.
узкий неразрывный пробел равен U+202F и равен 1/3em - еще более "визуально правильным" будет 1/8em "тонкий пробел" U+2009, но "тонкий пробел" не помечен как неразрывный (я слышу что InDesign автоматически обрабатывает его как ненарушающий.)

Ответы (7)

Это началось изогнутым

Апостроф впервые появился в печатной вселенной в Италии в 16 веке в виде изогнутой формы, обозначающей элизию , скопированную из рукописной классической итальянской поэзии. Апостроф был эквивалентен нашим «Попался» или «Хочу» в том смысле, что это был способ убрать жесткость текста, сделав его более похожим на человеческий.

Вот пример одного из первых случаев, когда апостроф был напечатан. Это из «Le cose volgari di messer Francesco», классического итальянского произведения, написанного Петраркой и опубликованного Альдусом Мануцием в Италии около 1501 года.

введите описание изображения здесь

Альд Мануций предположительно скопировал эту книгу с оригинальной рукописи Петрарки, принадлежавшей его другу. У него был специальный шрифт, разработанный на основе почерка поэта, создавший наклонный стиль, который мы сегодня знаем как «курсив». Ему пришлось ввести глиф апострофа, чтобы иметь возможность скопировать текст точно так, как его написал поэт. Обратите внимание на апостроф в слове (словах) «l'honorata». Обратите внимание, что он имеет изогнутую форму.

Это стало модным

Этот новаторский шрифт «Курсив» и стильный разговорный способ обозначения пропусков в виде симпатичного маленького знака сразу же приобрели известность. Даже когда шрифт был защищен самим Папой Римским, его начали незаконно копировать художники-фальшивомонетчики. Копии книги были напечатаны в Лионе пиратским шрифтом с апострофом и прочим.

В 1501 году Жоффруа Тори опубликовал книгу «Кампофлори», которая произвела революцию во французской грамматике и книгоиздании. Он ввел, среди прочего, апостроф, копируя новый модный итальянский способ считать исключения стильными. Это отрывок из книги. Обратите внимание на изогнутый апостроф.

введите описание изображения здесь

В том же веке и по тем же причинам английский язык заимствовал апостроф из французского.

Это стало прямым

Апостроф перестал быть новинкой и стал частью обычной грамматики. В печатных текстах он сохранил свою изогнутую форму. С другой стороны, прямой глиф, похожий на апостроф, имел разные функции, например, обозначал «простой». Однако в рукописных документах иногда это стилизовано под прямую галочку (см. комментарий Йорика ниже).

С изобретением пишущих машинок и клавиатур (1860-е годы) инженеры столкнулись с проблемой размещения множества символов (клавиш) на небольшом пространстве. Им пришла в голову идея объединить похожих персонажей, чтобы сэкономить место. Вместо левых, правых и прямых «апострофов» они решили включить только прямой. Аналогичные решения были приняты и в отношении других символов, распространенных в наборе текста, таких как длинное тире и короткое тире.

https://en.wikipedia.org/wiki/Typewriter#Typewriter_conventions

Этот сокращенный набор символов был закодирован в первом в мире двоичном наборе символов, 5-битном коде Бодо (1870 г.). В набор также входила прямая двойная кавычка в виде одного символа. 7-битный ASCII унаследовал тот же набор символов.

С тех пор весь печатный (и телеграфный) текст оформлялся только прямыми кавычками. Фигурные использовались только в традиционном наборном тексте.

Получилось неоднозначно

Только с популяризацией текстовых процессоров фигурные апострофы вновь появились в цифровом мире. Такие системы, как Word, предлагали функцию автоматической замены прямого апострофа фигурными кавычками в зависимости от контекста. Однако это был выбор пользователя, и не все текстовые процессоры имели эту функцию. Чтобы добавить путаницы, стандартные клавиатуры не включали фигурные кавычки, поэтому обычному пользователю было очень сложно ввести их намеренно.

Когда был создан Unicode, одним из принципов дизайна было «унифицировать» символы. Символы из разных сценариев или языков, которые выглядели одинаково, должны были быть объединены и упрощены как один. Вы могли бы подумать, что они вернулись бы к происхождению и избавились бы от прямого апострофа. Теперь, к этому моменту, путаница и свободное использование прямых и фигурных апострофов и кавычек были настолько велики, что Unicode решил включить и то, и другое.

Апостроф сегодня

Итак, как и сегодня, оба (фигурный и прямой апостроф) принимаются как апостроф и кавычка, но есть некоторые соображения:

  • Если цель текста состоит в том, чтобы он выглядел так, как если бы он был набран традиционным шрифтом, то всегда используйте фигурные, как это было изначально. Держите прямую, чтобы обозначить простое число.

  • Использование прямого апострофа и кавычек может быть способом передать цифровое настроение вашего документа, точно так же, как символы одинаковой ширины подразумевают, что текст был напечатан на пишущей машинке или консоли.

  • Если текст является цифровым и предназначен для восприятия человеческим глазом, оба (фигурный и прямой апостроф) принимаются как апостроф и кавычки. Здесь различаются школы и правила раскола. Продолжаем выразительный беспорядок. Просто будьте последовательны в пределах одного и того же документа.

  • Если цель текста состоит в том, чтобы быть семантически правильным (как если бы вы хотели, чтобы компьютер мог анализировать семантику текста), вам следует обратить пристальное внимание на определение символов в Unicode. U+0027(тот, который можно набрать с клавиатуры) называется «АПОСТРОП». Хотя это намекает на то, что он может быть хорошим кандидатом для представления апострофов, обратите внимание, что Unicode неоднозначно относится к этому символу, указывая на то, что, по крайней мере, в английском языке U + 2019 является предпочтительным для апострофов. Я лично считаю, что это противоречит их принципу унификации. Вы ожидаете, что апостроф будет одним и тем же независимо от языка, в котором он используется. Добавьте к этому тот факт, что они классифицируют апостроф как «пунктуацию», что во французском языке может быть неловко принято, но в английском не имеет никакого смысла. Таким образом, вы остаетесь в затруднительном положении: либо использовать разные апострофы для разных языков, либо использовать спорный апостроф для английского языка. Обсужденияо том, какой из них правильный, можно очень увлечься. С другой стороны, кажется совершенно очевидным, что U+2019 (и ни в коем случае не прямую) следует использовать в качестве правой кавычки. По той же причине U+2032 следует использовать для обозначения простого числа, а U+02BC следует использовать для обозначения апострофа с буквой-модификатором (например, в гортанной смычке произношения слова кокни слова bu'er или в транскрипции "uh'oh"). ").

  • Обратите внимание, что даже если вы выберете или наберете правильный символ, используемый вами шрифт может отобразить его фигурным или прямым образом.

если под «рукописным» вы имеете в виду «иллюстрированные рукописи», то, возможно, но у меня есть многочисленные старинные гроссбухи и журналы писем (один из них — том всей входящей и исходящей корреспонденции Бенджамина Франклина за короткий период) на расстоянии вытянутой руки от меня, где авторы просто используют прямой тик. Очень многие из них представляют собой «простой символ», а не загнутый символ. Большинство из них представляют собой почти неразборчивый вычурный шрифт с наклоном (например, курсивом), поэтому использование штриха может быть даже артефактом.
Примечание. Обратной стороной U + 02BC является U + 02BB, гавайская Окина , как и в самом названии «Гавайи».
[...] рукописные апострофы раньше были фигурными, как U+2019, и никогда не были прямыми, как U+2019 [...] Здесь опечатка?
@Yorik: Хороший вопрос. Добавлена ​​предыстория, уточнение и ссылка на ваш комментарий)
@TheodorosChatzigiannakis: Не стесняйтесь редактировать. Английский не мой родной язык.
FWIW, я почти уверен, что печатал фигурные апострофы, используя option + shift, до того, как Word внедрил «умные кавычки». Но я уверен, что я все еще в меньшинстве, когда дело доходит до того, чтобы печатать их самостоятельно, а не полагаться на функцию «умных кавычек».
«Когда был создан Unicode, одним из принципов дизайна было «унифицировать» символы. Символы из разных сценариев или языков, которые выглядели одинаково, должны были быть объединены и упрощены как один». - у вас есть источник для этого? Существует множество примеров того, как Unicode имеет несколько символов, которые выглядят одинаково, но я не знаю ни одного примера, где Unicode взял бы похожие символы и сделал их одним.
Имя символа Unicode НЕ является его определением! Текущая политика заключается в том, что имена не могут быть изменены; поэтому многие символы Unicode имеют вводящие в заблуждение или явно неправильные имена. Вместо этого вы должны посмотреть комментарии, чтобы увидеть, как его следует использовать. И комментарии недвусмысленно утверждают, что U+2019 семантически более корректен для представления апострофа, чем U+0027.
Вы можете не соглашаться с комитетом по Unicode, но ссылаться на имя — неправильный аргумент; вместо этого используйте аргументы, как в этом посте здесь: Какой символ Unicode должен представлять английский апостроф? (И почему комитет Unicode ошибается.)
@ user2357112: В настоящее время Unicode определяет в общей сложности примерно 120000 символов/глифов. В китайском словаре, составленном Министерством образования Тайваня, содержится 106 000 иероглифов. Таким образом, если бы Unicode мог составлять китайские документы, 88% из них были бы китайскими. И мы даже не начали рассматривать корейский и японский языки. Великая ханьская унификация (погуглите) была руководящим принципом, чтобы вместить как можно больше китайского, японского и корейского языков, оставив место для других языков. Они сделали это, убрав похожие символы из трех языков.
@ user2357112: Именно по этой причине в Unicode нет «китайской» плоскости, а есть «ханьская» плоскость, которую используют китайцы, японцы и корейцы.
@user2357112: Взгляните на принцип дизайна номер 5 здесь. unicode.org/versions/Unicode1.0.0/ch02.pdf
@sumelic: хорошая мысль. отредактировал этот бит и связал вашу статью, потому что это довольно интересно
@slebetman: Насколько я могу судить, это не похоже на визуальное сходство. (Также адресовано cockypup, но я не могу @ двух человек.)
@ user2357112: Из «Общих принципов стандарта Unicode»: 5 ​​— Стандарт Unicode кодирует символы в сценариях, которые можно использовать для ряда различных естественных языков. Пунктуация и символы, общие для всех сценариев, имеют единый код. 6 - Стандарт Unicode позволяет избежать дублирования символов, унифицируя их в разных языках: символам, которые эквивалентны по форме, использованию и основным свойствам, присваивается единый код (...).
@ user2357112: Другой противоречивый принцип проектирования заключался в том, чтобы разрешить двунаправленное преобразование с существующими наборами символов (например, серия ISO 8859); т.е. при преобразовании устаревшего текста в Unicode и обратно все различия должны быть сохранены. Это означало, что иногда символы приходилось хранить отдельно, потому что они уже были в некоторых устаревших наборах символов.
Прямые апострофы 'отличаются от простых чисел ʹ.
Большое спасибо за ваш потрясающий ответ! :) Это намного больше, чем я ожидал! :D Возможно, вы могли бы добавить раздел "TL;DR" в начале своего поста?!

Провел небольшое исследование, чтобы убедиться, но в целом «правильная» типографика не использует прямые кавычки, одинарные или двойные. Вот удобное руководство по командам и объектам HTML для одинарных/двойных фигурных кавычек .

Пишущие машинки также несут ответственность за введение «прямых кавычек», неспецифических кавычек, разработанных как мера экономии места для клавиатуры, позволяющая избежать необходимости в отдельных открывающих и закрывающих кавычках. Прямые кавычки обычно используются вместо правильных кавычек или «фигурных кавычек». Многие дизайнеры скажут вам, что прямые кавычки используются для представления футов и дюймов, но на самом деле футы и дюймы должны быть представлены с помощью простых чисел. Прямые кавычки устарели и не должны использоваться.

Из типографской грамотности: часть вторая (KA+A)

Тупые цитаты

Ну, апостроф — это только один знак, одинарная кавычка означает два знака, один начальный и один закрывающий знак. Какой глиф используется для этих знаков, зависит от используемого шрифта и глифов, которые шрифт дает вам для типографских знаков ...
Красиво сказано. Но ОП спрашивал об апострофе, а не о кавычках.

Комментарии стандарта Unicode к U+2019 (') :

это предпочтительный символ для апострофа

Что касается того, что правильно с точки зрения кодирования, я не могу думать о более высоком авторитете.

Кроме того, типографские соглашения большинства языков не используют U + 2019 для других целей или только как второстепенные кавычки. Фактически, британский английский является единственным основным языком, использующим этот символ в качестве основной кавычки. Таким образом, нет большой необходимости использовать здесь U+0027 (или любой другой символ) для различения.


Типографически существует три подхода к определению того, что является «правильным»:

  1. К чему люди привыкли . В то время как в классическом и профессиональном наборе люди в основном сталкиваются с фигурным апострофом, в цифровых текстах преобладает апостроф пишущей машинки. Здесь нет хорошего ответа.

  2. Что соответствует общему характеру шрифта без значительного ухудшения читабельности — это в некоторой степени зависит от шрифта. Давайте рассмотрим несколько примеров:

    введите описание изображения здесь

    Во всех примерах апостроф в слове Don’t — U+2019, а апостроф в amn’t — U+0027. Сначала обратите внимание, как оба символа различаются по шрифтам.

    • Первый пример — светлый шрифт без засечек. Это далеко не орнамент, и фигурный апостроф был бы неуместен. Следовательно, U+2019 лишь слегка наклонена. Прямая буква U+0027 также хорошо сочетается с простым характером шрифта.

    • Круглые формы, очевидно, являются основной парадигмой шрифта во втором примере. Следовательно, U+2019 фигурный. U + 0027 разработан, чтобы избежать любого направления (предположительно, чтобы его также можно было использовать в качестве открывающей кавычки) и, следовательно, кривых. Кроме того, он довольно маленький, по-видимому, компромисс между тем, чтобы не нарушать характер шрифта крупными буквами и ухудшать читаемость маленькими буквами. Если вы спросите меня, компромисс слишком незначительный, но это только симптом — реальная проблема заключается в компромиссе, которого можно избежать, используя фигурный апостроф, который намного лучше подходит к шрифту.

    • В классических шрифтах с засечками, как и в третьем примере, ширина штриха в основном зависит от угла (который берет свое начало в каллиграфии). Прямые вертикальные линии обычно заканчиваются засечками. Это не вариант для апострофа, и, следовательно, U + 0027 использует форму капли и, таким образом, нарушает характер шрифта (на мой взгляд). Правда, то же самое относится и к восклицательному знаку, но, по крайней мере, этот символ все равно будет мешать. Фигурная U+2019, на мой взгляд, намного лучше подходит к характеру шрифта.

    • Последний шрифт еще более каллиграфичен, но его характер предлагает другой способ оформления чисто вертикальных элементов. Таким образом, U+0027 не так тревожит и не так сильно отличается от U+2019.

    Подводя итог этому пункту: это зависит от шрифта, но правильно оформленный U+2019 никогда не должен быть хуже, чем U+0027, даже если последний хорошо разработан. Это неудивительно, потому что шрифтовой дизайнер может более гибко формировать U + 2019, чтобы он соответствовал остальной части шрифта, поскольку симметрия не требуется.

  3. Что лучше для удобочитаемости в долгосрочной перспективе . Использование одного и того же символа для многих целей, возможно, не очень хорошо для удобочитаемости. Таким образом, если мы предположим, что британские соглашения о наборе текста не изменились в остальном, прямой апостроф имеет то преимущество, что его можно отличить от фигурной закрывающей кавычки. Однако это соглашение (используйте U + 0027 для апострофа и U + 2019 для одиночной закрывающей кавычки) еще сложнее установить, чем установить использование фигурных кавычек и апострофов в цифровом мире.

    Во многих других языках это не имело бы большого смысла, так как U+2019 в любом случае не используется в качестве кавычки. В таких языках, как немецкий, в котором в качестве кавычки используется перевернутая буква U+2018 (', английская одинарная открывающая кавычка), наличие двух противоположных завитков или наклонов (в зависимости от шрифта) часто способствует лучшему различию — по крайней мере, на мой взгляд. .

Хороший ответ! :D Вы правы U+2019, не используется для кавычек в немецком языке: „ ...“ С другой стороны, я до сих пор удивляюсь, почему U+2019на немецко-австрийской клавиатуре нет клавиши.

Сначала немного истории .

Фигурные кавычки и апострофы были оригинальным стилем. Их также называют кавычками и апострофами принтера .

Прямые кавычки и апострофы пришли вместе с пишущей машинкой. Пишущая машинка, будучи механическим устройством с ограничениями, решила, что более целесообразно использовать один набор прямых знаков вместо двух отдельных наборов фигурных знаков (для открывающих и закрывающих одинарных и двойных кавычек).

Чтобы добавить еще больше путаницы, Простые числа также являются символом, который выглядит как угловой прямой апостроф. Штрихи используются для обозначения минут/секунд (а также других научных, математических и музыкальных обозначений). Опять же, для них также можно было использовать прямые апострофы пишущей машинки.

Тем не менее, некоторые шрифты разработаны только с прямыми апострофами и кавычками по стилистическим причинам.

Подводя итог: всегда используйте фигурную версию для фактических кавычек и апострофов, если только вы: а) не используете пишущую машинку 1954 года или б) у вас есть стилистические причины для использования прямых.

Очень хороший обзор :) Я никогда раньше не слышал о термине "Цитаты для принтеров"... И готов поспорить на что угодно, что 99 процентов будут использовать (неправильный) прямой апостроф для написания " s " :D

Есть один пункт, который до сих пор не упоминался во всех ответах. В интерфейсе командной строки или на языке программирования апостроф (символ UTF-8 27) является единственным допустимым выбором.

Использование U+2019 вызывает синтаксические ошибки при вырезании и вставке. С автоматическим переводом символа 27 в U + 2019 теперь это означает, что копирование командных строк из документов Word (или некоторых вики / веб-страниц) будет вызывать ошибки, которые заставят многих людей запутаться, пока эта проблема не будет указана. Это также может вызвать ошибки компилятора/интерпретатора, которые не имеют смысла.

При написании технических документов с примерами кода и/или командной строки убедитесь, что все созданные образцы используют символ 27, а не более высокое значение.

Из любопытства... нужны ли апострофы в коде или командных строках? Я не знаю многих языков кодирования, но я не могу вспомнить ни одного случая, когда нужен апостроф.
@DA01 C-подобные языки (такие как C, C++, Java, C#) используют U+0027 для обозначения односимвольных литералов: 'a'это односимвольный литерал «a». (Это отличается от строки, содержащей только букву a, в которой используется U+0022: "a"это строка, содержащая только букву «a».) Некоторые языки, такие как Javascript, позволяют взаимозаменяемо использовать одинарные и двойные кавычки (но у вас есть выбрать любой из них для конкретной строки). Другие языки (такие как Pascal, Ada, SQL) используют U+0027 для обозначения строковых литералов: в SQL 'a'это строка, содержащая только букву «a».
Как видите, во многих языках существует различие между односимвольными литералами и строками, состоящими только из одного символа. Оба имеют допустимое применение, и оба регулярно используются во многих ситуациях. Теперь, очевидно, можно обсудить, означает ли это, что есть необходимость в апострофе , но какой-то способ указать компилятору или интерпретатору разницу необходим в любом языке, который делает различие, и многие языки остановились на паре "и 'одном так или иначе.
Цитаты автоматических типографов могут быть адом в учебниках.
@MichaelKjörling ах, семантика, возможно, но мы говорим здесь об одинарных кавычках, а не об апостофе.
@ DA01 Вы правы в том, что ни один язык программирования не использует апостроф (U + 2019), но это потому, что почти ни один язык программирования не использует ничего, кроме символов ASCII более низкого порядка (первые 96 или около того символов из UTF-8). Таким образом, для языка программирования либо апостроф не существует, либо он совпадает с одинарной кавычкой, которая является тем же символом, что и тиковая кавычка принтера.
Интересно, что знак серьезности ( `, U+0060) используется, например, в оболочках UNIX для обозначения подстановки команд.
Да, это часто называют обратным тиком. Вы должны быть осторожны, чтобы не перепутать его с открытой одиночной «умной» цитатой. Замена его на что-то другое нарушает команды. Он также используется в C# (в основном для внутренней типизации).

Я работаю в исследовательском центре, и мы обычно используем довольно большие французские и немецкие корпуса (довольно свежие). Во французском корпусе прямой апостроф «появляется примерно в 4 раза чаще, чем фигурный апостроф». В немецком «прямой» не существует, и можно найти только кудрявый. Различия во французском корпусе на самом деле могут быть связаны с тем, что прямые буквы обычно используются в печатных текстах, а изогнутые — в основном из текстов копирования / вставки, которые размещаются в Интернете. С другой стороны, немецкие источники, по-видимому, используют исключительно фигурное «. Следует также учитывать тот факт, что апостроф гораздо чаще встречается во французском языке, чем в немецком.

Вопрос был о том, какой из них «правильно использовать». Интересно ваше мнение о реальных существующих текстах. Я люблю Францию, и тот факт, что они каким-то образом используют больше прямых, чем фигурных, косвенно подтверждает, что фигурные были бы «правильными для использования» (подмигнуть, подмигнуть). книги о правилах типографики для французского языка (как рекомендовали в другой теме), так что скоро я буду знать еще больше.

Правильным символом для размещения в опубликованном тексте в качестве апострофа является символ UTF-8 U+2019 , правильная одинарная кавычка. Это единственный символ, который даст вам желаемый результат, который представляет собой типографский апостроф книжного уровня. Когда вы используете инструмент для письма, который делает «умные кавычки», и вы нажимаете клавишу апострофа, инструмент вставит символ UTF-8 2019.

Апостроф буквы модификатора U+02BC символа UTF-8 — это крошечный апостроф для произношения. Это не будет выглядеть правильно в контексте написания «не могу».

Апостроф U+0027 символа UTF-8 — это «апостроф программиста». Он остался с зари вычислительной техники, когда компьютеры имели только 127 символов и были предназначены для написания компьютерных программ, а не для типографики книжного уровня. Первые 127 символов UTF-8 — это те же оригинальные 127 символов, а компьютерная клавиатура практически не изменилась, так что эта плохая типографика живет и живет, и живет.

Причина, по которой эта ошибка продолжает жить, заключается в том, что люди, унаследовавшие компьютерное наследие, не обязательно считают апострофы программистов ошибками. Люди, которые пришли из издательского наследия, делают это. Но именно компьютерщики проектируют компьютеры. Это не является оправданием для неправильных типографик в опубликованном тексте. Сегодня у нас есть замена текста, и у нас есть много способов обойти это.

В идеале писатели должны использовать инструменты, которые не позволяют им вводить апострофы программиста, потому что они просто добавляют ошибку в свою рукопись UTF-8. Конечно, редакторы это исправят, но подход «исправить потом» часто приводит к публикации ошибок.

Поэтому, если у вас есть рукопись любого рода — книга, рассказ, статья — и в ней есть программистские апострофы, вы должны заменить их символом UTF-8 2019 перед публикацией.

То же самое касается котировок программиста. Хорошие инструменты письма не должны позволять писателю печатать их, они должны печатать правильные кавычки, особенно потому, что их труднее исправить при редактировании, и это приводит к еще худшей читаемости, если они не фиксированы, по сравнению с апострофами.

В качестве примера инструмента для письма вы можете посмотреть на BBEdit, текстовый редактор, который десятилетиями использовался на Mac. Если вы создадите программный документ (HTML или другой язык) и нажмете клавишу апострофа, вы получите апостроф программиста. Если вы создадите письменный документ (обычный текст или Markdown) и нажмете клавишу апострофа, вы получите символ UTF-8 2019. То же самое касается кавычек. В документах по программированию вы получаете кавычки программиста. При написании документов вы получаете настоящие кавычки, как открывающие, так и закрывающие кавычки при вводе. Это лучший способ заключать кавычки, потому что инструмент может делать правильные открытые и закрытые кавычки, когда автор пишет. Во-первых, здесь не содержится никакой двусмысленности, поэтому ее нужно исправить позже (или нет).

Есть исключение из вашего правила. При написании образцов кода или командной строки в письменных документах апостроф программиста является правильным значением (другие вызовут синтаксические ошибки). Полные запреты или замены сломают команды/сэмплы. Поэтому персонаж должен быть разрешен для технических публикаций, в которых отображаются образцы кода или командной строки.
Так что только потому, что я пишу в Markdown, BBEdit говорит, что мне не следует использовать U + 0027? Многим людям на Stack Overflow может показаться, что что-то подобное, скажем так, менее чем оптимально.
Мне потребовалось некоторое время, чтобы понять, какого черта ты говоришь о U+8217: магазин CJK Unified Ideograph, магазин. Пожалуйста, используйте шестнадцатеричный формат для символов Unicode, т. е. U+2019 в вашем случае, или, по крайней мере, сообщите читателю о вашей нестандартной нотации.
Кроме того, это не символы UTF-8 , а символы Unicode или UCS. UTF-8 — это просто способ преобразования кодовой точки в байты. Так, например, U+2019 становится тремя байтами UTF-8, которые в шестнадцатеричном формате записываются как e2 80 99, а в десятичном виде 226 128 153.