Каковы потенциальные подводные камни использования негреческих/неевропейских символов в качестве символов в научном письме?

Итак, я стою перед дилеммой: недавняя публикация буквально израсходовала все (разборчивые) символы на этой странице . Мы тщательно проверили, и каждый символ необходим, и, к сожалению, необходимо столько символов, чтобы избежать путаницы (это то, что происходит, когда вы пытаетесь объединить несколько разных теоретических областей вместе). Мы также использовали множество символов, таких как звезды или точки . Этот вопрос не о том, как мне уменьшить количество символов.

Так что прямо сейчас я думаю об использовании иероглифов за пределами европейской семьи, таких как японские иероглифы (хирагана/катагана), корейские или китайские. Конечно, при условии, что эти символы достаточно просты. Некоторые кандидаты включают ひ, と, ㅈ, ㄹ, し, 十. Некоторые из этих символов вполне подходят и имеют простое произношение, хотя мы и не думаем произносить их в презентациях.

Но у меня есть два опасения:

  1. на большинстве конференций и журналов действует правило «Мы принимаем материалы только на английском языке» : материалы должны быть написаны на английском языке. Нарушает ли это эту политику?

  2. Нарушает ли использование этих символов какую-то имплицитную культурную норму в научной литературе и на европейских/североамериканских конференциях, так что нам следует избегать этого?

Обновлять:

Спасибо всем за отзывы. Но большинство, кажется, сосредоточены на том, какие другие шрифты я должен попытаться использовать вместо этого. В качестве пояснения: в моей области газеты нередко используют много-много символов. Вот небольшой недавний пример (не связанный с этими авторами), и этот , который я видел, заставил меня сказать: «вау, нотация такая приятная!» (опять же, не аффилированные). Кажется, это материалы конференции (около 10 страниц). Для полной подачи он может доходить до 20-40 страниц. Так что, как вы понимаете, быстро возникает проблема с символами.

Я не могу помочь, если все выходит так. Если вы заметили, легко найти использование таких вещей, как $a^{i,j}_{k,l}$. k и l — два агента из графов i и j, а a — всего лишь одна возможная переменная из множества переменных. Итак, мы уже активно используем надстрочные/подстрочные индексы. Мы используем шляпы для обозначения оценочных значений, поэтому мы уже там. Мы также используем mathcal, mathscr, mathbf, mathfrak, texttt и т. д. для обозначения наборов, графов, матриц, специальных матриц и особых условий соответственно. Все очень традиционные обычаи.

Я перенес в чат ряд комментариев, частично отвечающих на вопрос или предлагающих альтернативы. Пожалуйста, прочтите этот FAQ , прежде чем оставлять еще один комментарий.
Меня смущает обновление. Ни в одной из двух статей, на которые вы ссылаетесь, нет необычного количества символов. На самом деле, я думаю, что у большинства моих бумаг гораздо больше, и я никогда не рисковал исчерпать их.
@DenisNardin 1. Это не соревнование :), 2. Я уже упоминал, что эти статьи являются «мягкими» и «хорошими» примерами (посмотрите на даты этих препринтов: я схватил их на лету), и 3. Я не лгу о нехватке символов и задал этот вопрос для развлечения.
Также я серьезно просматриваю эти комментарии и взвешиваю их. Также думаю о том, чтобы просто вырезать некоторые символы.

Ответы (7)

Использование негреческих букв в уравнениях не так уж редко, как кажется. Хотя греческие буквы, очевидно, наиболее популярны, есть несколько общепринятых символов, взятых из других алфавитов, например

  • Русская буква ш (ша) используется в теории чисел и Л (эл) используется в некоторой гиперболической геометрии,
  • Еврейские буквы ℵ (алеф), ℶ (бет) и ℷ (гимел) обозначают соответственно числа алеф, числа бет и функцию гимель,
  • Староанглийское ð (eth) используется в контексте производных,
  • Мальтийский ħ обозначает постоянную Планка,
  • Японский よ (yo) используется в теории категорий.

Подробнее см . в этой теме . Я сам видел, как ℵ и ð используются в газетах, и я не работаю над какой-либо продвинутой математикой.

Хотя, безусловно, есть некоторые недостатки, связанные с удобочитаемостью статьи, написанной с использованием чрезмерного количества новых символов, формальных проблем с издателем быть не должно, если вы можете написать все символы в правильном сценарии LaTeX.

Кстати, в этом посте допущена ошибка (на что указал @DanRomik) с неправильным наименованием букв иврита, что достаточно хорошо иллюстрирует опасность использования новых символов, незнакомых как автору, так и читателям.

Есть ли у вас источники представления о том, что постоянная Планка имеет мальтийское происхождение? Он был немцем, и, согласно Википедии, имя переменной происходит от немецкого слова.
@WoJ не совсем. Но, насколько мне известно, мальтийский — единственный язык, который до Дирака получил этот символ от латыни (подобные буквы есть и в нелатинских славянских языках). Так что, вольно или невольно, при печати газет, вероятно, использовался существующий мальтийский символ. Кроме того, в 1900 году это мальтийское письмо было введено в Int. Фонетический алфавит, так что, возможно, именно так он проникает в математику. Это конечно только догадки. Кроме того, информация о Hilfsgrosse в вики относится к обычному h (без полосы) и взята только из анекдота в книге 2003 года. Кстати, символ был предложен Дираком, а не Планком.
Я думаю, что ð и ∂ немного разные символы. (Во всяком случае, ∂ больше похоже на русскую курсивную форму д, д .) Но есть также よ для вложения Йонеда!
Буква, которую вы называете гимел, — это бет, а ваша бет — гимел. Хорошая иллюстрация подводных камней использования незнакомых наборов символов…
@Deusovi, вы правы, но ð также используется, см., например, производные, взвешенные по вращению.
@DanRomik хороший улов
О $\partial$: исходя из моего любительского понимания истории этого, я думаю, что это не "eth", а просто какая-то форма курсивного "d", намеренно использовавшаяся разными людьми в 18 веке. Кроме того, я подозреваю, что Дирак и другие просто поставили косую черту через «h» как своего рода модификатор / ударение, а не сознательно приняли мальтийскую букву.
Вам нужно различать оптическое представление персонажа и то, как оно предназначено или интерпретировано. Если φ используется в математической литературе, мы произносим его фи , и это восходит к традиции использования греческих букв, потому что они были знакомы большинству читателей в то время. Если в физической литературе используется ℏ, мы произносим его как h bar (а не ħe ), и это происходит от модификации буквы h , используемой для аналогичной константы. Я не вижу причин предполагать, что это мальтийский символ или когда-либо считался мальтийским, даже в маловероятном случае, когда наборщик использовал мальтийский глиф.
Действительно хороший ответ. Все, что выглядит как буква, должно работать для переменных. Я помню, как в каком-то домашнем задании по математике закончились пригодные для использования буквы (на самом деле не так уж много разных букв в рукописи с учетом количества вещей, которым присвоены значения) и я вставил эльфийскую букву. Если бы я знал греческий алфавит в то время Я бы воспользовался этим, но не стал.

Вы делаете это неправильно и уже нарушаете культурную норму, которая гораздо важнее любой нормы, связанной с конкретным выбором набора символов.

Эта культурная норма такова: писать статьи, понятные другим людям.

Если вы используете все символы латинского и греческого алфавитов, а также точки, звезды и кучу других символов, так что у вас буквально закончились символы для использования, и вам все еще нужно больше, я готов поспорить, что ваша статья нарушает эту норму. самым худшим образом. Если вы добавите еще больше символов из других наборов символов, с которыми большинство людей на Западе незнакомы, вы будете только копать свою статью все глубже и глубже в черную дыру непостижимости.

Помимо этого, ответ на ваши два более конкретных вопроса — «вероятно» и «да», но я бы отнес эти опасения к разряду второстепенных по сравнению с упомянутым выше.

Итог: если Эндрю Уайлс смог доказать последнюю теорему Ферма, Перельман доказал гипотезу Пуанкаре, а бесчисленное множество других математиков и ученых-компьютерщиков постоянно успешно публикуют новаторские результаты, используя «только» латинский и греческий алфавиты и стандартные математические символы в своих целях. распоряжение, я уверен, что вы тоже могли бы изложить свою теорию с помощью этих ресурсов. Поэтому я предлагаю переосмыслить подход, стоящий за вашим вопросом, и спросить себя, почему вам нужно так много символов, а всем остальным - нет.

Изменить: еще пара замечаний по поводу вашего предложения:

  1. Стандарт Unicode, широко принятый как высший стандарт стандартизации текстовых представлений, определяет, что такое математический символ, и имеет несколько специальных блоков для этих символов (при этом некоторые стандартные символы попадают в другие блоки по историческим причинам, но все еще классифицируются как математические) . Ваша идея явно противоречила бы духу (если не букве) этого стандарта.

  2. Ваша идея также будет противоречить все более распространенной идее учета доступности и потребностей людей, использующих программы для чтения с экрана и другое программное обеспечение для специальных возможностей, во внимание при написании и публикации. По общему признанию, это также проблема с существующим математическим письмом , но ваша идея, безусловно, еще больше ухудшит ситуацию, чем она уже есть для (например) слепых читателей.

Использование символов вне блоков математических операторов не является «нарушением» стандарта Unicode. ( +не входит ни в какой математический блок, и вертикальные буквы, используемые для таких вещей, \sinтакже не являются строго математическими — это те же символы, которые вы печатаете каждый день!) Блоки — это просто общий способ организации символов, а не какой-либо вид предписания о том, как используются символы.
«Нарушением стандарта Unicode» будет использование, скажем, недопустимого байта в строке UTF-8 или шрифта, который переключает φ и ϕ. Unicode описывает , какие символы используются, и отмечает, что часто используются и другие символы [см. нижнюю часть страницы 5, где явно указано の]. Unicode не устанавливает никаких стандартов для того, как вы пишете, только для того, как это письмо должно быть закодировано.
unicode.org/versions/Unicode13.0.0/UnicodeStandard-13.0.pdf Страница 44: «Однако нормативный статус блоков не следует рассматривать как указание на то, что они определяют значащие наборы символов. По большей части блоки служат только как диапазоны для разделения кодовых диаграмм и не обязательно подразумевают что-либо еще о типах символов, найденных в блоке. нельзя надежно использовать в одиночку для обработки символов».
@Deusovi отредактировал, чтобы немного смягчить мое заявление о нарушении. Спасибо за ответ.
В нем говорится «не использовать комбинированные метки» для MathML , определенного языка разметки. И снова, это о том, как вы должны кодировать свое письмо. Unicode не дает никаких указаний о том, как вы должны писать текст или записывать вещи в целом — только о том, как это письмо должно быть закодировано в последовательность кодовых точек. Я согласен с тем, что использование других символов было бы нарушением социальной нормы, но эта норма никоим образом не связана с Unicode.
Unicode стандартизирует математическое письмо не больше, чем нематематическое письмо: когда, скажем, создаются новые китайские/японские символы, он расширяется, чтобы иметь возможность кодировать их, а не запрещать их. Стандарт касается того, как вы должны кодировать письмо, а не того, что вам разрешено писать в первую очередь.
@Deusovi достаточно честно. Я смягчил свое утверждение, как я уже сказал, но все же думаю, что обозначение Unicode определенных символов как математических имеет отношение к вопросу ОП. Утверждение, что эта норма «никоим образом не связана с Unicode», вводит ИМО в заблуждение.
Как инженер-программист, я нахожу ссылку на Unicode смехотворной. Весь смысл процесса стандартизации Unicode в том, что он следует общему использованию. Он не определяет общее использование. Если значительное число людей когда-либо использовали данный символ в серьезных целях (т. е. не что-то вроде клингонского или эльфийского письма), и консорциум Unicode знает об этом факте, то они, как правило, кодируют этот символ. Они не рассказывают людям, какие символы использовать.
@Kevin, они не говорят людям, какие символы использовать, но они назначают производные свойства символам, которые влияют на то, как они обрабатываются алгоритмами набора (разрыв строки, двунаправленный текст, кернинг и т. д.), и одно из этих производных свойств — это математика, которая применяется только к символам, традиционно используемым в математической нотации. Если бы OP спросил о написании латинских символов справа налево, сказали бы вы, что не имеет значения указывать на классификацию Unicode, что эти символы принадлежат тексту слева направо? Аналогично здесь. В любом случае, я остаюсь при том, что я сказал, но спасибо за ваше мнение.
@Кевин и Дэн: я думаю, вы можете встретиться посередине: если что-то не соответствует стандарту Unicode, это, по крайней мере, довольно экзотично. Хотя стандарт не говорит вам, какие символы вы должны использовать, он отражает, какие символы используются, и поэтому их следует использовать, если вы хотите придерживаться общего использования. Сравните со словарями: английский словарь не дает определения английскому языку и не говорит вам не использовать определенные слова, но он отражает использование. Таким образом, вы должны дважды подумать, прежде чем использовать слово, не содержащееся в словаре для широкой аудитории.
@Wrzlprmft: Эх, я бы даже не зашел так далеко. В Unicode есть много устаревшего дерьма, которое нельзя удалить или исправить из-за политики стабильности Unicode (которая запрещает изменять, переклассифицировать или удалять существующие символы после того, как они были добавлены в стандарт). Например, в Unicode есть все забавные латинские символы, похожие на рукописные, что, вероятно, заставляет вас думать, что это «настоящие» математические символы, но на самом деле они устарели и используются только для обратной совместимости, так как вы должны просто использовать шрифт для этого эффекта.
@Kevin: В Unicode много устаревшего дерьма, которое нельзя удалить или исправить - но это влияет на обратное утверждение (если что-то в Unicode, его можно использовать), которое никто не делал и здесь не имеет значения. — но на самом деле они устарели и используются только для обратной совместимости, поскольку для этого эффекта вы должны просто использовать шрифт — я не могу найти никаких доказательств этого. Наоборот, кажется , что они только что приняли больше из них. Также делать это правильно со шрифтом было бы довольно утомительно.
@Wrzlprmft: Ну, до недавнего времени я слышал такое отношение от людей, занимающихся Unicode. Видимо передумали. Тем не менее, дело в том, что Unicode в лучшем случае является серьезно отстающим индикатором, а вовсе не источником истины или набором лучших практик. Вы должны выяснить это сами, а затем рассказать о них Консорциуму, а не наоборот.
Подсказка: переменные/символы не обязательно должны быть уникальными во всей статье, они должны быть уникальными только в своем конкретном контексте . Я готов поспорить, что вы можете значительно сократить количество используемых переменных, разделив содержимое на более мелкие фрагменты и повторно используя символы для промежуточных шагов внутри каждого фрагмента. Если вам нужно так много символов в глобальном масштабе, возможно, вы делаете слишком много в одной статье.

В математическом письме обычно используются такие варианты:

Примеры

и, возможно, другие

Не забывайте об акцентах, так легко сотни вариантов.
Хорошая мысль, хотя я должен признать, что мне трудно читать сценарий и фрактур с первого взгляда.
«Трудно читать»… но не сложнее, чем と, ㅈ, ㄹ и т. д.
Справедливо. Я должен уточнить, что я не сравнивал с «と, ㅈ, ㄹ и т. д.», просто сделал замечание о своем собственном опыте.
Читателей также могут заинтересовать matheducators.stackexchange.com/q/4427/376 и matheducators.stackexchange.com/q/4437/376 . @GEdgar, я действительно вижу, что вы дали ответ на последний вопрос. Полное раскрытие: оба вопроса были заданы мной.
К счастью, заглавные греческие буквы используются редко.... :-)
С некоторыми шрифтами шрифт и каллиграфия могут быть не столь четкими, и получение обоих в любом случае может потребовать некоторых усилий.
@lalala, мне нравится ипсилон с большой буквы! :)

Если у вас действительно закончились символы, я бы попробовал другой путь.

В разработке программного обеспечения люди называют все, используя символы ASCII: они используют слова вместо отдельных букв.

Я знаю, что в математике обычно так не делают. Но, с другой стороны, вызов переменной стоимости costвместо c не сделает статью нечитаемой.

На самом деле я бы сказал, что программное обеспечение более удобочитаемо именно по той причине, что мы используем полные слова с реальным значением. Мне трудно понять математику, потому что мне все время приходится искать значение символов.
Способ написания математики утвердился, когда люди в основном писали от руки. Когда у вас мало места на доске и вы не хотите тратить время на то, чтобы все записывать, вы обычно используете короткие символы вместо слов. Математика часто очень сжата.
@Michael, правда, но есть и другие причины, по которым программное обеспечение более читабельно. Отрасль поощряет программистов документировать свой код и делать его понятным для других программистов. Они работают в более совместной среде (часто в больших командах, работающих над проектом и нуждающихся в редактировании одной и той же базы кода). Программисты и представители их индустрии также усердно работали над созданием набора передовых практик для облегчения хорошего общения и совместной работы. Я думаю, вы больше думаете о таких вещах, когда разница между хорошим и плохим общением составляет многие миллионы долларов…
@ Майкл Я не согласен, однако вы не должны недооценивать то, что математику часто бывает труднее понять просто потому, что она действительно сложнее . Длинную математическую формулу обычно становится еще труднее понять, если вы удлините имена переменных, даже если они будут более описательными, просто из-за дальнейшего увеличения размера . — Что действительно помогает для понимания, так это преобразование формул в подвыражения, теорем в более мелкие леммы, тем самым создавая небольшие области переменных, где можно быстро найти значение.
Если вы используете переменную, такую ​​как стоимость, в статье, способ уточнить, что она отклоняется от стандартной математической записи, — это использовать для нее другой шрифт. Я бы использовал шрифт пишущей машинки, намекая на то, что разработка программного обеспечения является основным источником такой записи.
+1 Математика обычно не решает большие задачи за один присест, поэтому краткая формулировка обычно имеет смысл. Однако в примерах OP математика в основном описывает сложный алгоритм. Разработчики также начали писать краткий код и, как вы говорите, быстро поняли, что код, который выглядит как математика, невозможно поддерживать или читать, когда экосистема разрастается до большего количества переменных, которые вы можете пересчитать по пальцам. Описательный псевдокод кажется гораздо лучшим языком для проблемы OP или, по крайней мере, для некоторого подмножества их проблемы.
@Майкл, я категорически не согласен. Попробуйте когда-нибудь написать математику словами с символами вместо символов. Это будет невыносимо и никак не удобочитаемо, все формулы будут очень длинными и трудными для просмотра. Если вы пишете логику программного обеспечения для бизнеса с базами данных или веб-интерфейсом, вы используете слова, но при вводе математического уравнения с узнаваемыми символами вполне нормально использовать символы. y = a*x**2 + b*x + cбудет более читаемым, чем result = quadratic_coefficient * input**2 + linear_coefficient * input + constant_coefficient.
@VladimirF Да, когда это что-то тривиальное, например квадратичное, конечно, это правда. Но когда четыре страницы краткой математики описывают единственный алгоритм, который можно было бы в равной степени описать в 100 строках псевдокода, аргумент несколько меняется. Есть также варианты между aи quadratic_coefficient, поэтому сравнение с крайностями, опять же, возможно, неискренне. Математика — это язык, созданный для представления функций и отношений. Языки программирования эволюционировали, чтобы четко выражать алгоритмы. Оба плохи, когда используются в областях, где специализируется другой.
@J... Нет! Это наоборот! Только такие тривиальные уравнения еще можно составить словами, действительно сложные станут полным адом, когда вы попробуете это сделать! И вопрос касается бумаги, а не программного обеспечения, и Майкл выступал за слова вместо символов в математике, это не я призывал отказаться от использования описательных имен в программном обеспечении. Я только продемонстрировал, что уравнения превращаются в кошмар, когда они написаны словами. И да, даже те, которые прямолинейно реализованы в программном обеспечении, как это часто бывает в математике, физике и технике.

Даже со списком символов читателям будет сложно отслеживать такое количество различных букв. Его можно упростить, введя порядок и иерархию символов.

Стиль будет варьироваться в зависимости от поля, но, например, вы можете:

  • Прописные буквы A, B, ... для основных символов, которые связывают воедино всю работу и появляются в нескольких разделах.
  • Подстрочные прописные буквы A x , B c , ... для символов, связанных (но не равных) одному из основных символов.
  • Строчные буквы a, b, ... для локальных параметров, которые потом можно повторно использовать для разных целей в разных разделах.

Это по-прежнему оставляет много символов, доступных для других целей. Для удобочитаемости вы должны использовать те же символы и соглашения, что и в других документах, в разумных пределах.

Как насчет букв с индексом, где индекс является описательным словом. Я имею в виду $\lambda_\textrm{min}$ и $\lambda_\textrm{max}$. Я думаю, что это отличный способ дать понять, что индекс не является индексом.
@Clumsycat На самом деле мы уже там. Два примера в настоящее время используются для обозначения максимального и минимального собственных значений. Опять стандарт в литературе.

Помимо других ответов о том, что статья, использующая такое количество символов, будет непонятной (я полностью поддерживаю эти ответы): многие издатели используют коммерческие пользовательские шрифты, и их шрифты могут просто не содержать символов для сценариев, отличных от латинского и греческого.

Даже европейские шрифты, такие как кириллица, вызывают проблемы. Посмотрите, например, что здесь произошло? Весь текст находится в Times, а реферат на русском языке — в Computer Modern: https://doi.org/10.1016/j.hm.2020.04.003

Вы обязательно должны использовать эти символы. Академия должна быть менее европоцентричной.

Основная цель статьи — быть понятой, а не делать геополитическое заявление. Раньше статьи писались на французском и немецком, а потом в основном на английском. Культурные нормы со временем меняются. Тем не менее, документы следует понимать, и я не думаю, что многие люди поймут документ, содержащий все латинские и греческие символы, а также некоторые азиатские символы для хорошей меры.
И чтобы быть дотошным, давайте воспользуемся каждым символом, когда-либо изобретенным каждой культурой, выбранной случайным образом, знаете ли, для увековечивания мировой истории.