Что такое интуитивный способ думать об определителе?

На моем уроке линейной алгебры мы только что говорили об определителях. До сих пор я хорошо понимал материал, но теперь я очень смущен. Я понимаю, что когда определитель равен нулю, матрица не имеет обратной. Я могу найти определитель 2 × 2 матрица по формуле. Наш учитель показал нам, как вычислить определитель н × н матрицу, разбив ее на определители меньших матриц. Видимо есть способ суммирования по куче перестановок. Но нотация действительно сложна для меня, и я действительно не знаю, что с ними происходит. Может ли кто-нибудь помочь мне интуитивно понять, что такое детерминант и как связаны все эти его определения?

Я просто хотел, чтобы этот вопрос был в архивах, потому что он извечный, и на него можно дать лучший ответ, чем в большинстве учебников.
Хе-хе, вы идете против собственного предложения задавать вопросы, на которые вы действительно хотите получить ответы!! Я дразню, хотя, я понимаю вашу мотивацию. Можем ли мы создать прецедент создания подготовленных вопросов CW? Мне нравится эта идея, я предложу ее на Мете. Я болтаю.
В случае, если кому-то была интересна форма трассировки этого вопроса, это более сложно и является предметом одного из моих вопросов MO: D mathoverflow.net/questions/13526/…
@BBischof, см. метатред для обсуждения CW
В конце концов, я надеюсь, что это не показалось мне ненавистью к вашему вопросу... Тем не менее, мне почему-то кажется, что это произошло.
нет, я так не считал... :)
Я в замешательстве - Кэти Бэнкс ответила на свой вопрос?
Те, кто читает этот форум в 16 году, могут быть заинтересованы в этом видео «Определитель» , которое является частью набора видео, которые дают очень хорошее представление об интуитивном понимании линейной алгебры (скорее, ее сути)
Потрясающий ресурс, который я использовал, чтобы мотивировать свое понимание определителя: askamathematician.com/2013/05/…

Ответы (17)

Ваши проблемы с детерминантами довольно распространены. Их также трудно хорошо научить по двум основным причинам, которые я вижу: формулы, которые вы изучаете для их вычисления, запутаны и сложны, и нет «естественного» способа интерпретировать значение определителя, способ сначала легко интерпретировать производные, которые вы делаете в исчислении, как наклон касательной. Трудно поверить в такие вещи, как условие обратимости, которое вы заявили, когда даже не ясно, что означают числа и откуда они берутся.

Вместо того чтобы показывать, что многие обычные определения одинаковы, сравнивая их друг с другом, я собираюсь сформулировать некоторые общие свойства определителя, которые, как я утверждаю, достаточны для того, чтобы однозначно указать, какое число вы должны получить, когда подставляете заданное число. матрица. Тогда неплохо проверить, что все определения определителя, которые вы видели, удовлетворяют тем свойствам, о которых я расскажу.

Первое, о чем следует подумать, если вы хотите, чтобы «абстрактное» определение определителя объединяло все остальные, — это то, что это не массив чисел с черточками по бокам. На самом деле нам нужна функция, которая принимает N векторов (N столбцов матрицы) и возвращает число. Предположим, что мы сейчас работаем с реальными числами.

Помните, как те операции, которые вы упомянули, изменяют значение определителя?

  1. Переключение двух строк или столбцов меняет знак.

  2. Умножение одной строки на константу умножает весь определитель на эту константу.

  3. Общий факт, из которого следует число два: определитель линеен в каждой строке . То есть, если вы думаете об этом как о функции дет : р н 2 р , затем

    дет ( а в 1 + б ж 1 , в 2 , , в н ) "=" а дет ( в 1 , в 2 , , в н ) + б дет ( ж 1 , в 2 , , в н ) ,
    и соответствующее условие в каждом другом слоте.

  4. Определитель единичной матрицы я является 1 .

Я утверждаю, что этих фактов достаточно, чтобы определить уникальную функцию , которая принимает N векторов (каждый из которых имеет длину N) и возвращает действительное число — определитель матрицы, заданной этими векторами. Я не буду этого доказывать, но покажу вам, как это помогает при некоторых других интерпретациях определителя.

В частности, есть хороший геометрический способ представить определитель. Рассмотрим единичный куб в N-мерном пространстве: набор N векторов длины 1 с координатами 0 или 1 в каждой точке. Определитель линейного преобразования (матрицы) T — это знаковый объем области, полученный применением T к единичному кубу . (Не беспокойтесь слишком сильно, если вы пока не знаете, что означает «подписанная» часть).

Как это следует из нашего абстрактного определения?

Что ж, если вы примените идентичность к единичному кубу, вы получите единичный куб. А объем единичного куба равен 1.

Если вы растянете куб на постоянный коэффициент только в одном направлении, новый объем будет таким же постоянным. И если вы сложите два блока вместе, выровненных в одном направлении, их общий объем будет суммой их объемов: все это показывает, что имеющийся у нас объем со знаком является линейным по каждой координате, если рассматривать его как функцию входных векторов.

Наконец, когда вы переключаете два вектора, определяющих единичный куб, вы меняете ориентацию. (Опять же, к этому можно вернуться позже, если вы не знаете, что это значит).

Таким образом, есть способы думать о детерминанте, которые не подталкивают символы. Если вы изучали многомерное исчисление, вы могли бы подумать, с помощью этого геометрического определения определителя, почему определители (якобиан) появляются, когда мы меняем координаты при интегрировании. Подсказка: производная — это линейная аппроксимация связанной функции, и рассмотрите «дифференциальный элемент объема» в вашей исходной системе координат.

Нетрудно проверить, что площадь параллелограмма, образованного векторами ( а , б ) и ( с , д ) является | с д а б | либо: вы можете попробовать это, чтобы получить представление о вещах.

Отличный ответ. На уроках алгебры нас учили определителю как обобщенной функции объема.
Надеюсь, вы не возражаете, но я исправил небольшую опечатку в третьем свойстве определителя и добавил немного латекса, чтобы тождество было немного легче читать.
Хорошо сделано. Мы все должны помнить об этом, когда обучаем детерминантам.
Просто из любопытства, с кем вы разговариваете с первым предложением? Вы не задавали вопрос?!? В любом случае, я постоянно указываю учащимся на эти вопросы (и ответы) для получения определяющей помощи.
@TheChaz этот вопрос задавали в самом начале Math.SE, когда возникла необходимость заполнить сайт вопросами, прежде чем он будет открыт для «общественности». В любом случае, отвечать на свои вопросы в наши дни настоятельно рекомендуется .
Чтобы увидеть, что геометрическая интерпретация (объем изображения куба) удовлетворяет свойству полилинейности, недостаточно сложить два «выровненных» блока, это опять же умножение столбца на скаляр. Вы должны иметь дело с двумя «не выровненными» блоками, созданными путем изменения одного вектора-столбца, и увидеть, что сумма их объемов является объемом блока, полученного путем сложения суммы двух векторов. Это не так просто поймать...
Я хочу поделиться этой ссылкой. На мой взгляд, это дает действительно хороший ответ на этот вопрос.
Есть ли кто-нибудь, кто автоматически понимает определитель сразу после его изучения?? :\
Почему включена аксиома (2)? (3) делает его излишним...
@JamieBanks Есть ли доказательства того, что этих свойств достаточно? Вы сказали, что не докажете это здесь, но я хотел бы увидеть один, если он существует.
У меня вопрос, по пункту 4. Там написано, что эта функция уникальна. В этом контексте, что мы подразумеваем под уникальностью?
Я выучил или переучил различные части линейной алгебры из шести-десяти разных учебников в разное время в моей жизни — я никогда не вспомню, как вычислять определитель, если не сделал этого недавно — и я никогда не видел это объяснение его значения. Окончательно!
@StanShunpike: Идея доказательства уникальности заключается в следующем. Напишите свои входные векторы в я на фиксированной основе е 1 , , е н . Используя (3), расширяйте все как можно больше, пока не получите сумму det, чьи входы являются просто базисными векторами. Используя (1), дет ( е 1 , е 1 ) "=" 0 и аналогично, поэтому n входных данных для каждого из этих dets являются различными базисными векторами в некотором порядке. Снова используя (1), измените их порядок, чтобы каждый дет ( е 1 , е 2 , , е н ) , что равно 1 по (4). Это заставляет значение дет на в 1 , , в н .
Знак и ориентацию нетрудно мотивировать. Вычислить дет ( с е 1 , е 2 , е 3 ) наглядно, поскольку c изменяется от 1 до -1. Объем | с | в каждом случае, и чтобы сделать этот процесс плавным, нам нужно подобрать негатив для с < 0 . Вы можете жестко вращать ( е 1 , е 2 , е 3 ) в ( е 2 , е 1 , е 3 ) который разумно должен сохранить дет , так дет ( е 2 , е 1 , е 3 ) "=" 1 . Тот факт, что вы можете постоянно делать такого рода выбор (и в основном, не делая выбора), на первый взгляд кажется маленьким чудом, но в любом случае это не вопрос мотивации.
Может ли кто-нибудь объяснить мне полилинейность объема параллелепипедов?
Откровенно говоря, если бы вопрос исходил от настоящего вопрошающего, этот ответ не помог бы. Вы ввели скорее инопланетную нотацию ( \mathbb{R}^n^2 ), учитывая геометрическую интерпретацию, подобную той, что используется в большинстве текстов (площадь параллелограмма), и которая вообще не дает никакой интуиции. После прочтения этого ответа у меня нет лучшего представления о том, как кто-то правдоподобно пришел к понятию определителя в первую очередь. Группа людей, которые уже понимают концепцию и оценивают ответ, является плохим тестом для определения образовательной ценности объяснения.
В числе 2 этих общих свойств разве деление строки на константу не умножает определитель на эту константу?
Вопрос: эквивалентно ли требование, чтобы вектор ж 1 в свойстве № 3) есть ж 1 "=" в к для некоторых к с 1 к н ? Позволить ему быть любым вектором кажется огромным ограничением для определителя.
Эмиль Артин, Теория Галуа (второе издание 1944 г., перепечатано Dover 1998 г.), страницы 11-20, аналогичным образом характеризует детерминантную функцию и доказывает, что она существует и уникальна.
@ChrisTaylor Хотя отвечать на свой вопрос нормально и поощрять, я не думаю, что это то же самое, что и подвергать сомнению свой собственный ответ (у меня есть это классное объяснение, если бы кто-нибудь задал мне соответствующий вопрос). В частности, наивность вопроса («в моем классе мы только что говорили о детерминантах», предполагая точку зрения ученика, а не учителя) явно сфабрикована и опровергается немедленным ответом ОП.
Этот ответ запутан в отношении ролей строк и столбцов. Если вы просматриваете (фактически задаете) определитель как функцию столбцов матрицы, то вам следует говорить о полилинейных и знакопеременных условиях только в столбцах . Вы получите другой вид полилинейности бесплатно (как только вы выведете инвариантность при транспонировании), но это не должно быть частью спецификации. На самом деле (3) говорит о линейности по строкам, но (если я интерпретирую обозначение по отношению к тому, что было сказано ранее) определяет линейность по столбцам. Трудно сделать из этого что-то определенное.
@MarcvanLeeuwen Честно говоря, я не вижу в этом проблемы, особенно с учетом того, что многие люди боролись с этим вопросом, и ответ ясен и полезен. Цитата из сообщения в блоге, на которое я ссылался (выделено мной), Stack Exchange — это «не просто платформа вопросов и ответов: это также место, где вы можете публиковать то, что вы узнали: рецепты, часто задаваемые вопросы, HOWTO, пошаговые руководства и даже фрагменты документацию по продукту, если вы отформатируете ее как вопрос и ответ ». (Кстати, вы понимаете, что комментарию, на который вы отвечаете, семь с половиной лет?)
У меня была та же мысль, что и у этого вопроса: «Что такое интуитивный способ думать о детерминантах», и именно так я сюда попал. Ответ был для меня очень проницательным, особенно в том, что он заложил некоторую геометрическую структуру, о которой я не знал. Спасибо

Вы можете представить себе определитель как объем. Думайте о столбцах матрицы как о векторах в начале координат, образующих края перекошенного прямоугольника. Определитель дает объем этой коробки. Например, в двух измерениях столбцы матрицы являются ребрами ромба.

Вы можете вывести алгебраические свойства из этой геометрической интерпретации. Например, если два столбца линейно зависимы, в вашем блоке отсутствует измерение, поэтому он был сведен до нулевого объема.

Если можно, я бы добавил к этому ответу (который я считаю очень хорошим) два второстепенных аспекта. Во-первых, определитель тоже имеет знак, поэтому нам нужна концепция ориентированного объема. (Это несколько сложно, но определенно важно, так что вы можете иметь это в виду, когда будете изучать «правила правой руки» и тому подобное.) Во-вторых, я думаю, что лучше, чем том, думать об определителе как о мультипликативе. изменение объема параллелепипеда при линейном преобразовании. (Конечно, вы всегда можете принять первое за единицу n-куба и сказать, что вы просто делите на единицу.)
Я опоздал на десять лет, но вот видео 3blue1brown об определителе, в котором используется та же геометрическая интерпретация.

В дополнение к ответам, приведенным выше, определитель представляет собой функцию от множества квадратных матриц в действительные числа, сохраняющую операцию умножения:

дет ( А Б ) "=" дет ( А ) дет ( Б )
и так несет с о м е информацию о квадратных матрицах в гораздо более знакомый набор действительных чисел.

Некоторые примеры:

Функция определителя отображает единичную матрицу я к единичному элементу действительных чисел ( дет ( я ) "=" 1 .)

Какое действительное число не имеет обратного мультипликативного числа? Число 0. Итак, какие квадратные матрицы не имеют мультипликативных обратных? Те, которые отображаются в 0 детерминантной функцией.

Что такое определитель обратной матрицы? Обратный определитель, конечно. (И т. д.)

Это свойство детерминанта «сохранять операции» объясняет некоторое значение функции определителя и дает мне определенный уровень «интуиции» в работе с матрицами.

Вот запись моей лекции о геометрическом определении определителей:

Геометрическое определение определителей

В нем есть элементы из ответов Джейми Бэнкса и Джона Кука, и он неторопливо излагает детали.

Я тоже нахожу наиболее интуитивным способ обращения с детерминантами во внешней алгебре. Определение дано на стр. 46 книги Ландсберга «Тензоры: геометрия и приложения». Два примера ниже расскажут вам все, что вам нужно знать.

Скажем, вам дают матрицу

А "=" ( а б с д )
и попросили вычислить его определитель. Вы можете думать о матрице как о линейном операторе ф : р 2 р 2 определяется

( Икс у ) ( а б с д ) ( Икс у ) .

Если вы определяете стандартный базисный вектор с помощью е 1 "=" ( 1 0 ) и е 2 "=" ( 0 1 ) , то вы можете определить ф значениями, которые он принимает на базисных векторах: ф ( е 1 ) "=" а е 1 + с е 2 и ф ( е 2 ) "=" б е 1 + д е 2 .

Линейный оператор ф распространяется на бивекторы с помощью

ф ( е 1 е 2 ) "=" ф ( е 1 ) ф ( е 2 ) .

Тогда вы можете написать

ф ( е 1 е 2 ) "=" ( а е 1 + с е 2 ) ( б е 1 + д е 2 ) "=" ( а д б с ) е 1 е 2 ,

где я использовал дистрибутивность и антикоммутативность произведения клина (последнее влечет а а "=" 0 для любого вектора а ). Итак, мы получаем определитель как скалярный множитель в приведенном выше уравнении, то есть

ф ( е 1 е 2 ) "=" дет ( А ) е 1 е 2 .

Та же процедура работает для матриц 3 на 3, вам просто нужно использовать тривектор. Скажем, вам дано

Б "=" ( а 11 а 12 а 13 а 21 а 22 а 23 а 31 а 32 а 33 ) .

Он определяет линейный оператор г : р 3 р 3

( Икс у г ) ( а 11 а 12 а 13 а 21 а 22 а 23 а 31 а 32 а 33 ) ( Икс у г ) ,

для которого у нас есть

г ( е 1 ) "=" а 11 е 1 + а 21 е 2 + а 31 е 3 , г ( е 2 ) "=" а 12 е 1 + а 22 е 2 + а 32 е 3 , г ( е 3 ) "=" а 13 е 1 + а 23 е 2 + а 33 е 3

на стандартной основе е 1 "=" ( 1 0 0 ) , е 2 "=" ( 0 1 0 ) , е 3 "=" ( 0 0 1 ) . Оператор г распространяется на тривекторы

г ( е 1 е 2 е 3 ) "=" г ( е 1 ) г ( е 2 ) г ( е 3 ) ,

который дает

г ( е 1 е 2 е 3 ) "=" ( а 11 е 1 + а 21 е 2 + а 31 е 3 ) ( а 12 е 1 + а 22 е 2 + а 32 е 3 ) ( а 13 е 1 + а 23 е 2 + а 33 е 3 ) .

Если после этого следовать правилам таких как дистрибутивность, антикоммутативность и ассоциативность, вы получаете

г ( е 1 е 2 е 3 ) "=" дет ( Б ) е 1 е 2 е 3 .

Точно так же это работает и в более высоких измерениях.

Для протокола я попытаюсь дать ответ на этот старый вопрос, так как я думаю, что некоторые элементы могут быть добавлены к тому, что уже было сказано.

Несмотря на то, что в основном это просто (сложные) выражения, определители могут быть загадочными при первом знакомстве. Естественно возникают следующие вопросы: (1) как они определяются вообще?, (2) каковы их важные свойства?, (3) почему они существуют?, (4) почему нас это должно волновать? и (5) почему становится ли их выражение настолько огромным для больших матриц?

С 2 × 2 и 3 × 3 определители легко определяются явно, вопрос (1) может подождать. Хотя (2) имеет много ответов, наиболее важными для меня являются: детерминанты обнаруживают (обращаясь в 0) линейную зависимость н векторы в измерении н , и они представляют собой выражение в координатах этих векторов (а не, например, алгоритм). Если у вас есть семейство векторов, которые зависят (или хотя бы один из них зависит) от параметра, и вам нужно знать, для каких значений параметров они линейно зависят, то попытка использовать, например, исключение Гаусса для обнаружения линейной зависимости может работать к проблеме: могут потребоваться предположения о параметре, чтобы гарантировать, что какой-то коэффициент отличен от нуля, и даже тогда деление на него дает очень беспорядочные выражения. При условии, что количество векторов равно размерности н пространства, однако взятие определителя немедленно преобразует вопрос в уравнение для параметра (которое можно или нельзя решить, но это другое дело). Именно так получают уравнение в задачах на собственные значения, если вы их видели. Это дает первый ответ на (4). (Но с детерминантами можно делать намного больше, как только вы к ним привыкнете.)

Что касается вопроса (3), загадка того, почему детерминанты вообще существуют, может быть уменьшена, если рассмотреть ситуацию, когда н 1 заданы линейно независимые векторы, и спрашивает, когда окончательный неизвестный вектор Икс останется независимым от них, с точки зрения своих координат. Ответ состоит в том, что обычно так и будет, фактически всегда, если только Икс оказывается в линейном диапазоне С из тех н 1 векторов, которое является подпространством размерности н 1 . Например, если н "=" 2 (с одним вектором в дано) ответ "если только Икс является скалярным множителем в ". Теперь, если представить себе фиксированную (ненулевую) линейную комбинацию координат Икс (технический термин представляет собой линейную форму в пространстве), тогда он станет 0 именно когда Икс находится в некотором подпространстве размерности н 1 . Если повезет, это можно устроить так, чтобы это был именно линейный отрезок С . (На самом деле удачи здесь нет: если расширить н 1 векторов еще одним вектором к базису, то выражая Икс в этом базисе и взятие его конечной координаты определит такую ​​линейную форму; однако вы можете проигнорировать этот аргумент, если вы не особенно подозрительны.) Теперь важное наблюдение состоит в том, что такая линейная комбинация не только существует, но и ее коэффициенты могут быть взяты как выражения в координатах нашего н 1 векторы. Например, в случае н "=" 2 если положить в "=" ( а б ) и Икс "=" ( Икс 1 Икс 2 ) , то линейная комбинация б Икс 1 + а Икс 2 выполняет работу (она становится 0 именно тогда, когда Икс является скалярным множителем в ), и б и а явно выражены в координатах в . На самом деле это линейные выражения. Для н "=" 3 при двух заданных векторах выражения для коэффициентов линейной комбинации более сложны, но их все же можно записать в явном виде (каждый коэффициент есть разность двух произведений координат, по одному образующих каждый вектор). Эти выражения линейны по каждому из векторов, если фиксирован другой.

Таким образом, приходят к понятию полилинейного выражения (или формы). На самом деле определитель представляет собой полилинейную форму: выражение, зависящее от н векторов, и является линейным в каждом из них, взятом в отдельности (привязывая остальные векторы к произвольным значениям). Это означает, что это сумма слагаемых, каждое из которых является произведением коэффициента и одной координаты каждого из всех н векторы. Но даже без учета коэффициентов таких слагаемых может быть много: колоссальная н н из них!

Однако нам нужно выражение, которое становится 0 когда векторы линейно зависимы. Теперь волшебство (вроде как) заключается в том, что даже, казалось бы, гораздо более слабое требование, чтобы выражение стало 0 когда два последовательных вектора среди н равны , гарантирует это и, кроме того, почти навязывает нам форму нашего выражения. Полилинейные формы, удовлетворяющие этому требованию, называются знакопеременными. Я пропущу (простые) аргументы, но переменная форма не может включать члены, которые принимают одну и ту же координату любых двух разных векторов, и они должны менять знак всякий раз, когда кто-то меняет местами роли двух векторов (в частности, они не могут быть симметричны относительно к векторам, хотя понятие линейной зависимости симметрично; обратите внимание, что уже б Икс 1 + а Икс 2 не симметричен относительно перестановки ( а , б ) и ( Икс 1 , Икс 2 ) ). Таким образом, любой термин должен включать каждый из н координаты один раз, но не обязательно по порядку: применяется перестановка координат 1 , 2 , , н к последовательным векторам. Более того, если терм включает одну такую ​​перестановку, то любой терм, полученный путем перестановки двух позиций в перестановке, также должен встречаться с противоположным коэффициентом. Но любые две перестановки могут быть преобразованы друг в друга повторной заменой двух позиций; так что если вообще есть какие-то термины, то должны быть термины для всех н ! перестановки, и их коэффициенты все равны или противоположны. Это объясняет вопрос (5), почему определитель является таким огромным выражением, когда н большой.

Наконец, существование определителей оказывается непосредственно связанным с тем, что знаки могут быть связаны со всеми перестановками таким образом, что перестановка элементов всегда меняет знак, который является частью ответа на вопрос (3). Что касается вопроса (1), то теперь мы можем сказать, что определитель однозначно определяется тем, что он н -линейное знакопеременное выражение в записях н векторы-столбцы, содержащие терм, состоящий из произведения их координат 1 , 2 , , н в этом порядке (диагональный член) с коэффициентом + 1 . Явное выражение представляет собой сумму по всем н ! перестановок, соответствующий член получается путем применения этих координат в порядке перестановки и со знаком перестановки в качестве коэффициента. О вопросе (2) можно сказать еще много, но я остановлюсь здесь.

Высшая внешняя сила н -мерное векторное пространство В является одномерным. Его элементы иногда называют псевдоскалярами, и они представляют собой ориентированные н -размерные объемные элементы.

Линейный оператор ф на В можно продолжить до линейного отображения на внешней алгебре по правилам ф ( α ) "=" α для α скаляр и ф ( А Б ) "=" ф ( А ) ф ( Б ) , ф ( А + Б ) "=" ф ( А ) + ф ( Б ) для А и Б лезвия произвольной марки. Интересный факт: некоторые авторы называют это расширение внешним морфизмом . Расширенная карта будет сохранять класс; то есть, если А является однородным элементом внешней алгебры степени м , затем ф ( А ) также будет иметь оценку м . (Это можно проверить по свойствам расширенной карты, которую я только что перечислил.)

Из всего этого следует, что линейное отображение на внешней алгебре В однажды ограниченный верхней внешней степенью, сводится к умножению на константу: определитель исходного линейного преобразования. Поскольку псевдоскаляры представляют ориентированные элементы объема, это означает, что определитель является именно фактором, с помощью которого карта масштабирует ориентированные объемы.

Здесь есть отличные ответы, которые очень подробные.

Здесь я даю более простой ответ, также обсуждаемый в википедии . Думайте о определителе как о площади (в 2D; в 3D это будет объем и т. д.) параллелограмма, состоящего из векторов:

Параллелограмм из векторов

Помните, что площадь параллелограмма является его основанием. × высота . Делая некоторые трюки с скалярным произведением, это дает определитель:

| а б с д | "=" а д б с "=" А р е а п а р а л л е л о г р а м

Вы можете поместить единичные векторы для каждого измерения, чтобы проверить единичную матрицу, увидев, что:

| 1 0 0 1 | "=" а д б с "=" 1 × 1 0 × 0 "=" 1

Это объем с матрицей 3 на 3, и он будет равен 1 во всех случаях, поскольку недиагональные элементы удаляют любой эффект от единственного значения, влияющего на объем в виде диагонального произведения единиц. В некоторых контекстах понимается, что система координат не изменяется.

Думая в этих терминах, мне также легче думать об сингулярных матрицах: невозможность взять обратную матрицу с определителем 0 теперь «ощущается» как попытка делить на 0, поскольку я могу думать об определителе как о "скалярное значение" матрицы. Это может не помочь другим, но если это поможет вам, отлично!

Я освежал свою линейную алгебру через Академию Хана и наткнулся на замечательный урок , посвященный скучным / кровавым деталям того, как получается вычисление площади параллелограмма. Проверьте это, для тех, кто хочет лучшего понимания!
Картинка/визуализация стоит тысячи слов (как и ответы выше).

Если у вас есть матрица

  • ЧАС то вы можете рассчитать корреляционную матрицу с помощью
  • г "=" ЧАС × ЧАС ЧАС (H ^ H обозначает комплексно-сопряженную и транспонированную версию ЧАС ).

Если вы выполняете разложение по собственным значениям г вы получаете собственные значения λ и собственные векторы в , то в сочетании λ × в описывает одно и то же пространство.

Теперь есть следующее уравнение, говорящее:

  • определитель( ЧАС * ЧАС ЧАС ) = Произведение всех собственных значений λ

То есть, если у вас есть 3 × 3 матрица ЧАС затем г является 3 × 3 тоже дает нам три собственных значения. Произведение этих собственных значений равно объему прямоугольного параллелепипеда. С каждым дополнительным измерением/собственным значением кубоид получает дополнительное измерение.

(Я думал сделать это комментарием, но подумал, что он может заслуживать большего внимания, чем комментарий. Голоса за и против скажут, прав я или нет).

Дополнение о знаке определителя

Мне понравился принятый ответ Джейми, но я был разочарован тем, что он не дал дополнительных объяснений о знаке определителя и понятии «вращение» или «ориентация» вектора. Ответ от Марка Ван Леувена больше комментирует это, но, возможно, этого недостаточно для всех - по крайней мере, для меня - чтобы понять, что означает для матрицы изменение ориентации пространства, которое она преобразует. Поэтому я погуглил эту проблему и в итоге нашел следующее объяснение, которое я считаю отличным и доступным:

http://mathinsight.org/determinant_linear_transformation#lintrans3D

Хотя уже есть несколько отличных ответов, я думаю, что есть один аспект, который еще недостаточно освещен. А именно, учитывая, что матрицу можно рассматривать как представление линейного преобразования в данном базисе, что определитель матрицы говорит нам о данном преобразовании ?

Предположим, что у нас есть форма в нашем векторном пространстве, любая форма, с единственным ограничением, которое состоит в том, что она имеет четко определенный объем. Теперь мы можем спросить, что делает данное линейное преобразование с объемом этой формы?

Ну, первое, что мы замечаем, это то, что если мы возьмем направление, любое направление, и растянем фигуру вдоль этого направления с положительным коэффициентом, оставив все ортогональные направления неизменными, объем также будет умножен на этот коэффициент. Также, если мы «растянем» форму с коэффициентом 0 (сделав его плоским), он явно будет иметь объем 0 впоследствии, так что это правило хорошо распространяется и на этот пограничный случай.

Кроме того, если мы повернем форму (или оставим ее как есть), объем также не изменится. Обратите внимание, что не изменять громкость означает умножать громкость на единицу.

Обратите внимание, что все вышеперечисленное не зависит от формы, а является свойством только преобразования. Поэтому имеет смысл присвоить каждому такому преобразованию Т функция, назовем ее дет Т , который сообщает нам коэффициент, который мы должны применить к объему, чтобы получить объем изображения.

Конечно, если мы делаем несколько таких преобразований подряд, и каждое из них умножает объем на определенный множитель, то множители тоже умножаются. То есть,

дет ( Т 1 Т 2 ) "=" ( дет Т 1 ) ( дет Т 2 ) .

Теперь, присмотревшись к вышеизложенному, мы видим, что мы еще не охватили все возможные преобразования. Мы рассмотрели все те преобразования, которые можно выполнить с помощью комбинаций растяжения и вращения, но мы еще не знаем, что делать при зеркальном отображении. Давайте рассмотрим конкретный случай зеркального отражения в одном направлении, то есть изменение знака одного направления на противоположное и сохранение всех остальных. Назовем это зеркальное преобразование М .

Что ж, на первый взгляд кажется очевидным, что делать: Зеркальное отображение не меняет объем любой формы, поэтому дет М "=" 1 , верно? Но затем заметим, что когда мы пишем doen М , это действительно натяжка с фактором 1 . Поскольку мы всегда умножаем, этот множитель 1 всегда можно избавиться, применив абсолютное значение в конце. Но имеет ли этот фактор геометрический смысл?

Ну, есть много фигур, которые не идентичны своему зеркальному отображению, и оказывается, что если вы хотите непрерывно преобразовывать их в свое зеркальное отображение посредством линейных преобразований, вам всегда нужно проходить через форму с объемом 0 . Так что знак действительно несет геометрическую информацию, так что хранить ее также имеет смысл с геометрической точки зрения.

Поскольку все линейные преобразования могут быть получены последовательностями одномерных растяжений, вращений и одномерных зеркальных преобразований, мы теперь полностью определили значение дет Т на любое преображение. Также интуитивно понятно, что оно хорошо определено (если мы достигнем одного и того же преобразования разными способами, оно все равно повлияет на объем фигур точно так же).

Теперь, когда мы определили влияние на преобразование, мы можем посмотреть, что оно означает для матрицы.

Очевидно, что диагональная матрица является произведением растяжек/отражений в координатных направлениях, поэтому определитель диагональной матрицы — это просто произведение ее диагональных элементов. Замена двух столбцов или строк матрицы означает отражение в соответствующем диагональном направлении до или после применения исходного преобразования, поэтому это дает коэффициент 1 . Если матрица необратима (столбцы линейно зависимы), изображение будет иметь нулевой объем, поэтому определитель равен 0 . И стандартные базисные векторы отображаются в столбцы вектора, поэтому единичный куб, натянутый на базисные векторы, будет отображаться на параллелепипед, натянутый на вектор-столбцы, объем которого, следовательно, будет задан выражением | дет А | .

это гораздо более интуитивное объяснение того, что такое детерминант. Более сложная часть связана с ориентацией преобразования, что может сделать результирующий объем отрицательным. +1

Подумайте о скалярном уравнении,

а Икс "=" б
где мы хотим решить для Икс . Мы знаем, что всегда можем решить уравнение, если а 0 , однако, если а "=" 0 тогда ответ "это зависит". Если б 0 , то мы не можем ее решить, однако, если б "=" 0 тогда есть много решений (т.е. Икс е р ). Ключевым моментом является то, что возможность однозначного решения уравнения зависит от того, а "=" 0 .

Когда мы рассматриваем аналогичное уравнение для матриц

А Икс "=" б

вопрос о том, можем ли мы решить ее, не так легко решить тем, можем ли мы А "=" 0 потому что А может состоять из всех ненулевых элементов и по-прежнему не разрешима для б 0 . В самом деле, для двух разных векторов у 1 0 и у 2 0 мы могли бы очень хорошо иметь это

А у 1 0
и
А у 2 "=" 0 .

Если мы подумаем о у как вектор, то существуют направления, по которым А ведет себя как ненулевое (это называется пространством строк ) и другими направлениями, где А ведет себя как нуль (это называется пустым пространством ). Суть в том, что если А ведет себя как нуль по некоторым направлениям, то ответ на вопрос "есть А Икс "=" б вообще решаема для любого б ?" это "это зависит от б ". Точнее, если б находится в пространстве столбца А , то есть решение.

Итак, есть ли способ, которым мы можем сказать, является ли А ведет себя как ноль в некоторых направлениях? Да, это определитель! Если дет ( А ) 0 затем А Икс "=" б всегда имеет решение. Однако если, дет ( А ) "=" 0 затем А Икс "=" б может иметь или не иметь решения в зависимости от б а если есть одно, то и решений бесконечное множество.

Один из способов трактовки определителя, который проясняет связь между всеми упомянутыми вами различными понятиями, заключается в следующем:

Учитывая векторное пространство Е размера н над полем К и основа Б "=" ( б 1 , . . . , б н ) из Е , определитель представляет собой единственный (отличный от нуля) знакопеременный полилинейный н -форма ф из Е который удовлетворяет ф ( б 1 , . . . , б н ) "=" 1 .

Это просто означает, что определитель является функцией ф который принимает кортеж ( Икс 1 , . . . , Икс н ) из н векторы Е и возвращает скаляр из поля К , такой, что

(1) ф является линейным в каждом из н переменные ( Икс 1 , . . . , Икс н ) (это "многолинейный")

(2) если два из Икс я равны, то ф ( Икс 1 , . . . , Икс н ) "=" 0 ( ф «чередуется»)

(3) Оказывается, множество функций ф удовлетворяющие двум вышеуказанным свойствам, все кратны друг другу. Итак, выбираем основу Б из е и говорят, что определитель есть функция ф удовлетворяющий вышеуказанным свойствам, который отображает Б к 1 .

Конечно, не сразу очевидно, что такая функция ф существует и уникален!

Чтобы немного упростить, возьмем векторное пространство Е быть К н и основа Б быть канонической основой.

Оказывается, определитель удовлетворяет тому чудесному свойству, что д е т ( Икс 1 , . . . , Икс н ) 0 если и только если ( Икс 1 , . . . , Икс н ) является основой.

Теперь ... дано н векторы Икс 1 , . . . , Икс н такое, что для координат в базисе Б из Икс я являются ( а я , 1 , . . . , а я , н ) , определитель н -векторы Икс 1 , . . . , Икс н можно показать равным

о е С н с г н ( о ) а 1 , о ( 1 ) . . . а н , о ( н )

которое должно быть вам знакомо как выражение определителя в терминах перестановок. Здесь С н — симметрическая группа, т. е. множество перестановок { 1 , 2 , . . , н } и с г н ( о ) является сигнатурой перестановки о .

Чтобы установить связь между определителем множества н векторов к определителю матрицы, только заметим, что матрица А "=" ( а я , Дж ) это именно та матрица, векторы-столбцы которой равны Икс 1 , . . . , Икс н .

Таким образом, когда мы берем определитель матрицы, на самом деле мы оцениваем функцию с точки зрения н векторы-столбцы. Ранее мы говорили, что эта функция отлична от нуля тогда и только тогда, когда н векторы образуют базис - другими словами, тогда и только тогда, когда матрица имеет полный ранг, т.е. тогда и только тогда, когда она обратима.

Таким образом, абстрактное определение определителя как функции, которая отображает набор векторов в скалярное поле (при этом подчиняясь некоторым хорошим свойствам, таким как линейность), эквивалентно функции от матриц к скалярному полю, которая отлична от нуля точно, когда матрица обратима. Более того, эта функция оказывается мультипликативной! (Следовательно, ограничение этой функции на множество обратимых матриц дает гомоморфизм групп из ( г л н ( К ) , × ) к ( К / { 0 } , * ) .

Выражение определителя матрицы через перестановки может быть использовано для получения многих хороших свойств, с которыми вы знакомы, например

  • матрица и ее транспонирование имеют один и тот же de

  • det треугольной матрицы является произведением диагональных элементов

  • формула Лапласа, известная как расширение кофактора, которое говорит вам, как вычислить определитель с точки зрения взвешенной суммы определителей подматриц:

дет ( А ) "=" я "=" 1 н ( 1 ) я + Дж а я , Дж Δ я , Дж

где Δ я , Дж является определителем матрицы, полученной из А удалив строку я и столбец Дж , известный как минор ( я , Дж ) .

Представьте себе совершенно общую систему уравнений

а 11 Икс 1 + а 12 Икс 2 + а 13 Икс 3 "=" б 1
а 21 Икс 1 + а 22 Икс 2 + а 23 Икс 3 "=" б 2
а 31 Икс 1 + а 32 Икс 2 + а 33 Икс 3 "=" б 3

Если мы решим для переменных Икс я в терминах других переменных и запишем результаты в наименьших терминах, мы увидим, что выражения для каждого Икс я у всех одинаковые функции а я Дж в знаменателе. (Скажем, мы работаем над целыми числами.) Это выражение (с точностью до единицы) является определителем системы .

Если вы выберете систематический способ решения н × н систем, скажем, методом исключения Гаусса, вы можете использовать его, чтобы вывести формулу для этого определителя.

Я думаю, что это гораздо более естественно, чем другие подходы, потому что вы начинаете с чего-то простого и общего, например, с системы линейных уравнений, затем опускаете голову и решаете ее, и это понятие появляется.

Конечно, это дает вам ответ только с точностью до знака, но на самом деле это имеет смысл, потому что вводится произвольный выбор знака.

У Гарибальди есть статья, в которой представлен этот и некоторые родственные подходы, озаглавленная « Определитель и характеристический многочлен не являются специальными конструкциями» . (Чтобы формализовать это, вы хотите ввести небольшую теорию колец, чтобы у вас были формальные понятия неопределенности и так далее.)

Упомянутая статья arxiv.org/abs/math/0203276

Постараюсь объяснить это интуитивно. Но сначала вы должны понять некоторые понятия. Рекомендую ролики 3b1b для интуиции в "линейных комбинациях". В любом случае, это не сложная для понимания концепция, я немного представлю ее.

Прежде всего, давайте начнем с примера, а затем попробуем обобщить. Итак, представьте, что у нас есть матрица А "=" [ 3 1 1,5 2 ] .

Теперь давайте возьмем векторы-столбцы этой матрицы, [ 3 1,5 ] и [ 1 2 ] . Линейная комбинация этих векторов — это то, что мы называем пространством столбцов — Col(A) , все возможные комбинации этих векторов:

а [ 3 1,5 ] + б [ 1 2 ] для a и b как действительные числа.

Графически это выглядит примерно так (для а и б как целые числа):

Также у нас есть Row Space - Row(A) , тождественно определяемый как линейная комбинация векторов-строк р 1 "=" [ 3 1 ] и р 2 "=" [ 1,5 2 ] . Их можно представить графически так же, как с Col(A).

введите описание изображения здесь

Таким образом, определитель — это площадь, созданная параллелограммом, заданным векторами-строками (вектор-столбец генерирует ту же площадь, но для удобства давайте будем использовать векторы-строки). На изображении он представлен синим параллелограммом. Итак, площадь параллелограмма "=" Д е т е р м я н а н т ( А ) "=" Д е т ( А ) .

Итак, как мы можем рассчитать эту площадь? Для понимания этой части вы должны иметь базовые знания в «операциях со строками» и «площадях параллелограмма».

Давай позвоним " р 1 "первый ряд и" р 2 " вторая строка. Одна из основных операций над строками заключается в добавлении к одной строке другой масштабируемой строки. Итак, представьте, что строка работает с р 1 как р 1 "=" р 1 + к р 2 , к любое действительное число. Не отчаивайтесь, если вы не понимаете, почему мы работаем на ряду, все сразу станет ясно.

Итак, назовем B новой матрицей, сгенерированной после замены р 1 к р 1 + к р 2 . Так, р 1 с кавычками будет преобразованной версией р 1 . Что произойдет с Row(A) и Det(A)? Посмотрите, что произойдет с Row(B) и Det(B), когда мы изменим р 1 к р 1 "=" р 1 + к р 2 с разными значениями для к :

Итак, мы можем видеть, что р 1 движется параллельно р 2 что очевидно, потому что мы добавляем масштабированную версию р 2 к р 1 .

Предполагая, что у вас есть знания в «областях параллелограмма», вы можете убедиться, что основание и высота не меняются. Это означает, что площадь остается постоянной при добавлении одной строки, масштабируемой к другой строке, потому что мы не меняем высоту и никогда не двигаемся параллельно. Таким образом, Det(A)=Det(B) .

Итак, вот и ВОЛШЕБНАЯ ЧАСТЬ , мы должны найти к таким образом, что мы исключаем y-компоненту р 1 вектор-строка (y-компонента "=" А 12 "=" 0 ). Таким образом, применяя операцию строки с к "=" 1 2 такой, что А 12 "=" 0 , преобразованная матрица будет:

[ 3 1 1,5 2 ] р 1 1 2 р 2 [ 2,25 0 1,5 2 ]

Итак, наша матрица B имеет треугольную форму, Row(B) выглядит так:

введите описание изображения здесь

Теперь у нас есть параллелограмм с длиной основания "=" 2,25 и высота длина "=" 2 . Таким образом, по определению площади параллелограмма мы имеем, что Д е т ( А ) "=" Д е т ( Б ) "=" 2,25 * 2 "=" 4,5 . Таким образом, определитель — это просто произведение диагональных элементов треугольной матричной формы, которую мы называем ступенчатой ​​формой. МАГИЯ

Мы могли бы найти прямоугольник с той же площадью, что и Det(A), повторив этот процесс, но на этот раз применив операцию строки к р 2 так что мы исключаем его x-компоненту (x-компоненту "=" А 21 "=" 0 ) таким образом, что мы получаем прямоугольник с площадью Det(B), которая имеет площадь, эквивалентную Det(A), но это совершенно не нужно, так как это не меняет основание и высоту параллелограмма. В любом случае для интуиции этого процесса р 2 "=" р 2 + к р 1 будет выглядеть так:

Так к "=" 2 3 0,66 .

[ 2,25 0 1,5 2 ] р 2 2 3 р 1 [ 2,25 0 0 2 ]

Имеем, что база 2,25 и высота 2 , поэтому площадь прямоугольника Д е т ( Б ) "=" 4,5 "=" Д е т ( А ) . Определитель — это просто произведение диагональных элементов диагональной матрицы.

Итак, мы видели, что произведение диагональных элементов преобразованной матрицы в треугольную форму дает нам определитель матрицы. Почему треугольной формы? Представлять себе Икс я будучи я измерение, поэтому каждый вектор-строка в форме эшелона матрицы добавляет новый компонент к я измерение, поэтому с точки зрения геометрии он добавляет высоту к измерению.

Преимущество этой техники в том, что ее можно применять к любым n-мерным измерениям и поддерживать интуитивное понимание того, что вы делаете. Я хотел бы представить трехмерное графическое доказательство, но это потребует большой работы, которую, я думаю, вы могли бы сделать, проявив немного воображения. Идея состоит в том, что при добавлении масштабной версии вектора к другому вектору вы двигаетесь параллельно гиперплоскости, в которой лежит этот вектор, поэтому высота не изменяется.

Я пытаюсь сделать интуитивно понятный и геометрический процесс, используя эту Библиографию:

Хорошая работа и более интуитивно понятная анимация для элементарных операций со строками/столбцами.
The determinant of a matrix gives the signed volume of the parallelepiped
that is generated by the vectors given by the matrix columns.

Вы можете найти очень педагогическое обсуждение на странице 16

Наглядное введение в дифференциальные формы и исчисление на многообразиях Fortney, JP

ссылка на книгу Google, нажмите «1 справочный материал»

Дан параллелепипед, ребра которого равны в 1 , в 2 , , в н е р н . Затем, если вы принимаете эти 3 свойства:

  1. Д ( я ) "=" 1 , где я "=" [ е 1 , е 2 , , е н ] (единичная матрица)
  2. Д ( в 1 , в 2 , , в н ) "=" 0 если в я "=" в Дж для любого я Дж
  3. Д линейный,
    Дж ,   Д ( в 1 , , в Дж 1 , в + с ж , в Дж + 1 , , в н ) "=" Д ( в 1 , , в Дж 1 , в , в Дж + 1 , , в н ) + с Д ( в 1 , , в Дж 1 , ж , в Дж + 1 , , в н )

ты можешь показать это Д - объем параллелепипеда со знаком и что Д является определителем.

Позволять А 1 , , А н е Ф н быть линейно независимым (и, следовательно, базисным). Итак, для любого б е Ф н , существуют уникальные Икс 1 , , Икс н с Икс 1 А 1 + + Икс н А н "=" б .
Но неясно, каковы явные значения Икс я с (с точки зрения А я песок б ) являются.

Для любой линейной карты Т : Ф н Ф , Икс 1 Т ( А 1 ) + + Икс н Т ( А н ) "=" Т ( б ) .
Итак, если мы можем указать (явно) линейную карту Т 1 : Ф н Ф с Т 1 ( А 2 ) "=" "=" Т 1 ( А н ) "=" 0 и Т 1 ( А 1 ) 0 , Икс 1 можно вычислить как Икс 1 "=" Т 1 ( б ) Т 1 ( А 1 ) .
В общем, если мы укажем линейные карты Т 1 , , Т н : Ф н Ф с Т я ( А Дж ) "=" 0 для я Дж и Т я ( А я ) 0 , в Икс я s можно вычислить как Икс я "=" Т я ( б ) Т я ( А я ) .

Итак, если мы каким-то образом построим полилинейную карту ф : Ф н × × Ф н Ф где я) ф ( в 1 , , в н ) "=" 0 если любые два аргумента равны, и ii) ф ( в 1 , , в н ) 0 в любое время в 1 , , в н линейно независимы, мы закончим

Принимая Т Дж : Ф н Ф ,

  Т Дж ( в ) "=" ф ( А 1 , , в Дж т час  поз. , , А н ) .


Оказывается, такая конструкция возможна и уникальна с точностью до умножения на ненулевые скаляры. С учетом нормализующего ограничения ф ( е 1 , , е н ) "=" 1 , мы получаем уникальную карту, называемую определителем.