Инструменты для поиска сломанного встроенного контента

Мы только что перевели наш веб-сайт на повсеместное использование ssl, но это привело к неработающему встроенному контенту в браузерах.

Есть ли инструмент, который я могу использовать для сканирования всего сайта в поисках такого неработающего контента (в основном видео), чтобы я мог исправить/заменить? Контента достаточно, чтобы делать это вручную было бы утомительно. Я уже иногда использую средство проверки ссылок, чтобы найти ссылки с ошибкой 404 и тому подобное, но оно не находит неработающие вставки (афаик).

Можете ли вы уточнить, что вы подразумеваете под сломанным встроенным контентом в браузерах?
По большей части видео, которые браузер не загружает из-за не ssl-адреса. В итоге остается пустое место на странице.
Вы не пробовали сыщик ссылок Ксену? Он существует уже несколько десятилетий и хорошо работает для меня - home.snafu.de/tilman/xenulink.html
Используете ли вы CMS для управления сайтом? Например, WordPress. Возможно, вы ищете инструмент, написанный для этой CMS, для сканирования базы данных и изменения протокола для вас? Например, https://interconnectit.com/products/search-and-replace-for-wordpress-databases/ .
Вы когда-нибудь находили решение?

Ответы (3)

Я предлагаю попробовать просканировать сайт с помощью Screamingfrog .

Я бы проверил ваши файлы журналов веб-сервера, в зависимости от того, в каком формате (например, общий формат журнала Apache), вы сможете увидеть код состояния (ищите 404), запрашиваемый, но не найденный ресурс и URL-адрес ссылки ( на какой странице была ссылка/вставка)

Если весь ваш контент должен быть https или ssl, вы должны иметь возможность сканировать сайт с помощью Scrapy и проверять наличие ссылок на сайте, но не правильный тип с помощью Beautiful Soup 4 .

Просто используйте Scrapy, чтобы найти все страницы, проанализируйте с помощью BS4 и проверьте встроенные элементы.