Зная, что слова в письменном языке могут быть представлены комбинациями символов (например, букв алфавита), мне было бы интересно узнать, какие виды структурных ограничений существуют для отдельных слов. Конкретно у меня два вопроса:
1) В принципе может ли письменный язык содержать бесконечное количество слов?
2) В принципе, может ли язык содержать некоторые слова, которые представлены только нелинейной структурой букв? Например, можно ли считать «словом» следующий набор символов, если предположить, что математика — это язык?
Недавно я наткнулся на термин Морфема
В лингвистике морфема — это наименьшая грамматическая единица языка. Другими словами, это наименьшая значимая единица языка. Область исследования, посвященная морфемам, называется морфологией. Морфема не идентична слову, и принципиальное различие между ними состоит в том, что морфема может стоять отдельно, а может и не стоять отдельно, тогда как слово по определению является самостоятельным. Когда он стоит сам по себе, он считается корнем, поскольку имеет собственное значение (например, морфема кошка), а когда он зависит от другой морфемы для выражения идеи, он является аффиксом, поскольку выполняет грамматическую функцию (например, -s в словах кошек, чтобы указать, что это множественное число).[1] Каждое слово состоит из одной или нескольких морфем.
Кроме того, что касается понятия слова, интересно отметить этот термин в контексте информатики , где учитывается размер слова.
В вычислительной технике слово является естественной единицей данных, используемой конкретной конструкцией процессора. Слово — это фрагмент данных фиксированного размера, обрабатываемый как единое целое набором инструкций или оборудованием процессора. Количество битов в слове (размер слова, ширина слова или длина слова) является важной характеристикой любой конкретной конструкции процессора или компьютерной архитектуры.
В ответ на (2),
«Определенный интеграл от x = a до x = b числа Эйлера, умноженного на себя x — число раз» — это не предложение, а скорее предикат в сочетании со связкой. Здесь это может быть слово как пропозициональный термин, который является референтом вышеупомянутого предикатного термина.
Это слово в той мере, в какой сказуемое без связки может быть словом. Это предикат, потому что он относится к свойствам, которые находятся в расширении этой математической функции. Приравнять функцию к чему-либо — значит создать предложение, в котором «равно» является связкой сказуемого. Например, «Определенный интеграл от x=a до x=b числа Эйлера, умноженного на самого себя x-количество раз, равен числу Z» в логике первого порядка имеет следующую форму (где P — предикат термин «равно числу Z» и где Q является предикатным термином «равен определенному интегралу от x=a до x=b числа Эйлера, умноженному на себя x-количество раз»:
∃y:Py∧Qy.
Совершенно другой вопрос, истинно ли категорическое суждение. Возможно, что ∃y:Py∧Qy ложно, так что ∄y:Py∧Qy возможно истинно.
1) В принципе может ли письменный язык содержать бесконечное количество слов?
Большинство языков могут генерировать выражения, содержащие бесконечное количество слов. Решающим аргументом в пользу этого для меня стал пост Аллана С. Векслера .
(2) if and only if there exist utterances of infinite length.
This inference is false. A simple counterexample: Although there are
only a finite number of digits (= language elements) and although no
decimal numeral (= utterance) is of infinite length, there are
undoutedly an infinite number of decimal numerals.
Наши врожденные грамматики допускают существование таких фраз. Также рассмотрите этот список самых длинных слов в разных языках , где многие языки допускают произвольное составление слов. Самый длинный пример — слово из 431 буквы на санскрите, написанное где-то в Средние века. Или рассмотрим английский пример научного имени Титин, состоящего из 189 819 букв. Правила физики и химии могут помешать нам создавать бесконечно большие молекулы, но правила номенклатуры ИЮПАК не мешают нам создавать имена для бесконечно длинных молекул. Используем ли мы санскритские правила сандхи или номенклатуру ИЮПАК, грамматика не мешает нам образовывать бесконечно длинные слова.
В принципе, может ли язык содержать некоторые слова, представленные только нелинейной структурой букв?
Большинство индийских шрифтов не такие линейные, как латинские. В деванагари есть составные и конъюнкты , в которых одни буквы изменяют другие буквы слева, справа, сверху, снизу или внутри. Но почему это актуально? Индийские языки также могут быть записаны в линейной форме, обычно с помощью IAST или ITRANS . То же самое касается математических выражений. Ваш двумерный пример часто написан линейным способом в LaTeX или Mathematica.
Если вы действительно не любите кандзи и вообще логорамы, иероглифы и идеограммы , я понятия не имею, почему.
Я полагаю, вы могли бы возразить, что идеогармы — это буквы, но я почти уверен, что эти символы — не алфавит .
Письменные знаки в других системах письма лучше всего называть силлабограммами (обозначающими слог) или логограммами (обозначающими слово или фразу).
Произносимые слова состоят из звуковых единиц, называемых фонемами, а письменные слова — из символов, называемых графемами, таких как буквы английского алфавита.
Ясно, что символы являются графемами:
В письме используются дополнительные графические компоненты, такие как знаки препинания, математические символы, разделители слов, такие как пробел, и другие типографские символы.
Что касается ваших вопросов:
Все языки суть конструкции, и любое бесконечно длинное слово было бы невозможно написать, и этот язык не мог бы быть написан. Если только вы не допустите графему, которая говорит, например, что предшествующие буквы должны были быть произнесены бесконечное число раз. Это был бы запланированный язык
Я могу только догадываться, что вы подразумеваете под «нелинейной структурой букв», но, например, в китайском языке есть 214 радикалов в словаре Канси, и
Радикалы могут появляться в любом месте персонажа. Например, радикал 女 появляется слева в символах 姐, 媽, 她, 好 и 姓, но появляется внизу в 妾.
Мне было бы интересно увидеть язык, помимо математики, в котором аналогичным образом используется алфавит.
Это кажется очень странным вопросом с точки зрения языков, как они есть на самом деле .
В принципе, может ли язык содержать некоторые слова, которые могут быть представлены только бесконечными последовательностями букв
Нет. В конце концов, наука смотрит на доказательства; и уместным доказательством здесь являются естественные языки; нет языков с «бесконечными последовательностями букв»; и это легко вывести из принципа - у кого будет время выписывать такую последовательность?
Грамматики представлены автоматами с конечным числом состояний; существует Хомская иерархия формальных грамматик типов 0-3.
Тип грамматики, который подходит для такого языка, как вы предлагаете, - это тип 0; но это потому, что он позволяет все, они эквивалентны машине Тьюринга, так что больше похожи на компьютер, чем на настоящую живую грамматику; хотя я не должен, что даже настоящие компьютеры имеют конечные ресурсы, поэтому не существует такой вещи, как настоящая машина Тьюринга с бесконечной лентой.
Линейные структуры слов, предложений, абзацев и даже книг на естественных языках можно объяснить свойством человеческого мозга обрабатывать символы последовательно, по одному за раз. Интересно, но звуки и образы мы обрабатываем по-разному, и поэтому мы можем слышать сразу все музыкальные инструменты в оркестре и можем сразу видеть зрительные объекты. По этой причине музыкальные аккорды — это не просто последовательности нот, а изобразительные элементы на рисунках не располагаются линейно.
Другое дело — языки программирования. Используемые для взаимодействия человека с компьютером, эти языки предназначены для представления одной и той же информации в двух разных формах: в виде исходных кодов для людей и в виде машинных кодов для компьютеров. В то время как исходные коды представляют собой линейные структуры - они выглядят почти как тексты на естественных языках; машинные коды не являются линейными структурами — компьютеры не обрабатывают машинные коды последовательно, в заранее определенном порядке.
Кроме того, язык математики, вероятно, самый сложный случай. Например, несомненно, что математическая формула, представляющая закон всемирного тяготения, содержит некоторую информацию; однако я не уверен, кто/что является создателями и первичными потребителями этой информации: это сами физические объекты, гравитационное поле вокруг этих объектов, или это только мое воображение предлагает этот закон? Более того, даже неясно, сколько информации содержит эта формула: мало ли байтов данных, которых как раз достаточно для написания этой формулы, или бесконечное количество информации, определяющей все возможные гравитационные траектории в нашей Вселенной.
пользователь4894
пользователь4894
Мауро АЛЛЕГРАНСА
Мауро АЛЛЕГРАНСА
пользователь19423
пользователь9166
пользователь2953
Новифф
Новифф
пользователь19423
Новифф
пользователь19423
Новифф
пользователь19423
Мауро АЛЛЕГРАНСА
пользователь6917
Новифф