Ожидаемое время быстрой сортировки

Question

Ожидаемое время быстрой сортировки

сортировка
алгоритмы
Математика
Информатика
анализ-алгоритмов
вычислительная сложность

пользователь175343

Читаю доказательство теоремы:

Алгоритм быстрой сортировки сортирует последовательность $n$ элементы в $O(n \log n)$ ожидаемое время.

Доказательство таково:

Для простоты временного анализа предположим, что все элементы $S$ различны.

Это предположение максимизирует размеры $S_1$ и $S_3$ , и, следовательно, максимизировать среднее время, затрачиваемое на рекурсивные вызовы (QUICKSORT( $S_1$ ), БЫСТРАЯ СОРТИРОВКА( $S_3$ )).

Позволять $T(n)$ — ожидаемое время, необходимое БЫСТРОЙ СОРТИРОВКЕ для сортировки последовательности $n$ элементы.

Четко, $T(0)=T(1)=b$ для некоторой константы $b$ .

Предположим, что элемент $a$ (стержень, который выбирается случайным образом) — это i-й наименьший элемент $n$ элементы в последовательностях.

Затем два рекурсивных вызова QUICKSORT (QUICKSORT( $S_1$ ), БЫСТРАЯ СОРТИРОВКА( $S_3$ )) имеют ожидаемое время $T(i-1)$ и $T(n-i)$ , соответственно.

С $i$ с равной вероятностью принимает любое значение между $1$ и $n$ , а остаток QUICKSORT( $S$ явно требует времени $cn$ для некоторой константы $c$ , имеем отношение:

\begin{matrix} (1) & Т (н) \leq с н + \frac{1}{н} \sum_{я "=" 1}^{н} [Т (я - 1) + Т (н - я)], для н \geq 2 \end{matrix}

$T(n) \leq cn +\frac{1}{n} \sum_{i=1}^{n} [T(i-1)+T(n-i)], \text{ for } n\geq 2 \tag {1}$

Алгебраические манипуляции $(1)$ урожаи

\begin{matrix} (2) & Т (н) \leq с н + \frac{2}{н} \sum_{я "=" 0}^{н - 1} Т (я) \end{matrix}

$T(n) \leq cn +\frac{2}{n}\sum_{i=0}^{n-1}T(i) \tag {2}$

Покажем, что для $n \geq 2$ , $T(n) \leq kn \log_e n$ , где $k=2c+2b$ и $b=T(0)=T(1)$ .

Для основы $n=2$ , $T(2)\leq 2c+2b$ следует непосредственно из $(2)$ .

Для шага индукции напишите $(2)$ как

\begin{matrix} (3) & Т (н) \leq с н + \frac{4 б}{н} + \frac{2}{н} \sum_{я "=" 2}^{н - 1} к я {бревно}_{е} я \end{matrix}

$T(n) \leq cn +\frac{4b}{n}+\frac{2}{n}\sum_{i=2}^{n-1} k i \log_e i \tag {3}$

С $i \log_e i$ вогнута вверх, легко показать, что

\begin{matrix} (4) & \sum_{я "=" 2}^{н - 1} я {бревно}_{е} я \leq \int_{2}^{н} Икс {бревно}_{е} Икс г Икс \leq \frac{н^{2} {бревно}_{е} н}{2} - \frac{н^{2}}{4} \end{matrix}

$\sum_{i=2}^{n-1} i \log_e i \leq \int_2^n x \log_e x dx \leq \frac{n^2 \log_e n}{2}-\frac{n^2}{4} \tag {4}$

Замена $(4)$ в $(3)$ урожаи

\begin{matrix} (5) & Т (н) \leq с н + \frac{4 б}{н} + к н {бревно}_{е} н - \frac{к н}{2} \end{matrix}

$T(n) \leq cn+\frac{4b}{n}+kn \log_e n-\frac{kn}{2} \tag {5}$

С $n\geq 2$ и $k=2c+2b$ , следует, что $cn+4b/n\leq kn/2$ .

Таким образом $T(n)\leq kn \log_e n$ следует $(5)$ .

Как мы получили отношение $(1)$ ?

Заранее спасибо.

Редактировать:

Можете ли вы объяснить мне эту фразу:

«Это предположение максимизирует размеры $S_1$ и $S_3$ , и, следовательно, максимизировать среднее время, затрачиваемое на рекурсивные вызовы (QUICKSORT( $S_1$ ), БЫСТРАЯ СОРТИРОВКА( $S_3$ )). "

?

Почему это максимизирует среднее время, затрачиваемое на рекурсивные вызовы?

Ответы (1)

Ожидаемое время быстрой сортировки

Мелкосиний · Answer 1

Быстрая сортировка сводится к:

Выбор точки поворота
Разделить большой список на список «меньше сводного» $S_{1}$ и список «больше сводного» $S_{2}$
Сортировать $S_{1}$ и $S_{2}$ отдельно, результат вызова $S_{1}'$ и $S_{2}'$ .
Объединить $S_{1}'$ и $S_{2}'$ и перейти к окончательному отсортированному списку $S'$ .

Случайный выбор опорной точки — это постоянное время. Отсюда следует, что

$T(n) \leq [\text{Step 2}] + [\text{Step 3}] + [\text{Step 4}]$

Шаг 2 занимает $an$ время для некоторой постоянной $a$ . Вы просто делаете проход по списку, сравниваете его с опорным и добавляете его в любой $S_{1}$ или $S_{2}$ . Шаг 4 занимает не более $bn$ время по менее очевидным причинам. Следовательно, шаги 2 и 4 занимают не более $cn$ время для постоянного $c$ .

Шаг 3 остается. Выражение

$\displaystyle\frac{1}{n}\displaystyle\sum_{i = 1}^{n}\left[T(i-1)+T(n-i)\right]$

это среднее значение $T(i-1)+T(n-i)$ общий $i$ , и это рекурсивный шаг, сортировка двух строго меньших списков. Следовательно, приведенная выше сумма представляет собой среднее время, необходимое для выполнения шага 3.

В заключение, весь процесс занимает менее $cn + \displaystyle\frac{1}{n}\displaystyle\sum_{i = 1}^{n}\left[T(i-1)+T(n-i)\right]$ время.

Хорошо. И почему $T(n)$ меньше или равно сумме этих двух значений?
Отредактировано для уточнения. Дайте мне знать, если у вас есть дополнительные вопросы.
Используем ли мы среднее значение $T(i-1)+T(n-i)$ потому что мы хотим найти ожидаемое время быстрой сортировки?
Кроме того, когда мы выбираем опорную точку случайным образом, это также постоянное время?
Ага. На самом деле, наихудший случай для быстрой сортировки $O(n^{2})$ , когда у вас есть список, отсортированный в обратном порядке, потому что вам нужно выбрать $n$ поворачивается, и каждый внутренний шаг будет $O(n)$ время также.
Ха-ха, это хороший вопрос. Теоретически получение случайного числа — это постоянное время. Псевдослучайные числа также вычисляются быстро. На практике компьютер может выполнять некоторые странные вычисления, и получение чего-то «настоящего» случайного с помощью генератора случайных чисел может занять много времени. $O(n)$ или $O(n^{2})$ время, где $n$ это максимальное значение, которое вы хотите.
Я понимаю! Спасибо за объяснение! У меня есть и другой вопрос... В пункте "покажем, что для $n \geq 2$ , $T(n) \leq k n \log_e n$ , где $k=2c+2b$ и $b=T(0)=T(1)$ ", почему мы берем это $k$ ? И почему мы берем базу $e$ для $\log$ ?
Он выбрал это $k$ просто работая в обратном направлении; он знает это $k$ должно быть не более чем некоторой константой в зависимости от характера вопроса.
Одним из результатов теории алгоритмов является то, что основание журнала не имеет значения при рассмотрении временной сложности. Если что-то равно O (log_2 (n)), то это также O (log_e (n)) и O (log_100 (n)) и т. д. Таким образом, он использует log_e (то же самое, что и ln), поэтому интеграл упрощается. .
Не могли бы вы объяснить мне также это предложение: «Это предположение максимизирует размеры $S_1$ и $S_3$ , и, следовательно, максимизировать среднее время, затрачиваемое на рекурсивные вызовы (QUICKSORT( $S_1$ ), БЫСТРАЯ СОРТИРОВКА( $S_3$ )). "? Почему это максимизирует среднее время, затрачиваемое на рекурсивные вызовы?
Привет! Как насчет ожидаемой глубины? Почему это $O(\log n)$

Ожидаемое время быстрой сортировки

пользователь175343

Ответы (1)

Мелкосиний

пользователь175343

Мелкосиний

пользователь175343

пользователь175343

Мелкосиний

Мелкосиний

пользователь175343

Мелкосиний

Мелкосиний

пользователь175343

Сергей Зайцев

Расчет времени выполнения по временной сложности

Какова временная сложность при равномерной выборке записей bbb без замены записей nnn?

Как оценить затраченное время? (темпы роста)

время работы алгоритма с учетом временной сложности

Время выполнения быстрой сортировки

Использование mergesort merge() для сортировки k упорядоченных массивов

Сложность алгоритма — цикл for внутри цикла while; уменьшается в 2 раза

Что означает слово «масштабируемость» с точки зрения Big O?

Формулировка сортировки списка как чисто математической задачи

Сравнение временной сложности двух алгоритмов (неравенство)