Как найти страницы без текста на сайте?

Автор go.seo, 23-06-2017, 11:07:45

« назад - далее »

go.seoTopic starter

Друзья, всем привет. Я сейчас работаю помощником seo специалиста. Часто бывают задачи написать ТЗ на тексты, например: найти на сайте пустые страницы и написать на них ТЗ. Специалист в компании делает это вручную, но по-моему это бред и куча времени тратится не эффективно. Пробовал Screaming Frog - interlal, фильтр HTML - вкладка word count, но там показывает очень мало страниц, не все пустые находит, если не сказать, что вообще пустых не видит (в основном 404 и 301 редирект)  ???

Пустые страницы имеется ввиду страницы, которые есть, но без текста (не 404).

Вопрос в том, как автоматизировать нахождение пустых страниц на тексте... может посоветуете программу или какой способ, главное чтобы не вручную перебирать.


zanuda

#1
Для поиска пустых страниц на сайте и написания ТЗ на них можно воспользоваться инструментами для сканирования и анализа контента, такими как "Sitebulb", "DeepCrawl" или "ContentKing". Эти инструменты могут проанализировать содержимое всех страниц сайта и выявить пустые страницы, т.е. те, где отсутствует текст или другой контент.

"Sitebulb" и "DeepCrawl" позволяют выполнять глубокий аудит контента сайта, показывая страницы с недостаточным контентом или полностью пустые. Они также предоставляют детальные отчеты и аналитику, что поможет вам быстро выявить проблемные страницы.

Также можно использовать инструменты для анализа HTML-кода страниц, например "ContentKing". Он позволяет сканировать HTML-код каждой страницы и искать отсутствие контента или текста.

Вы также можете попробовать использовать инструменты для сканирования и аудита сайта, такие как "Screaming Frog SEO Spider" или "SEMrush Site Audit". Эти инструменты позволяют сканировать веб-сайт на наличие пустых страниц, отсутствие текстового контента и других проблем с SEO.

"Screaming Frog SEO Spider" позволяет проводить тщательный анализ каждой страницы сайта на наличие текстового контента и выявлять пустые страницы. Он также позволяет создавать отчеты о найденных проблемах.

"SEMrush Site Audit" предоставляет подробный анализ структуры сайта, включая проверку на пустые страницы и отсутствие контента. Он также может предложить рекомендации по оптимизации контента и исправлению обнаруженных проблем.

Кроме того, для автоматизации поиска пустых страниц на сайте и составления ТЗ можно использовать инструменты для сканирования контента, например Python-скрипты с использованием библиотеки Beautiful Soup для парсинга HTML-кода страниц. Этот метод позволяет создать собственный скрипт, который будет просматривать каждую страницу сайта и определять отсутствие текста или контента.

Также можно сочетать несколько инструментов и методов, например использовать Screaming Frog для первичной фильтрации страниц с недостаточным контентом, а затем дополнительно анализировать эти страницы с помощью Python-скриптов для более детального поиска пустых страниц.
  •  


go.seoTopic starter

Те, кто делал сайт изначально. Они создали сразу много страниц, но не наполнили их контентом, вроде как на будущее. А сейчас надо найти все эти страницы и наполнить их контентом.

LOGOS

Цитата: go.seo от 23-06-2017, 20:13:22
Те, кто делал сайт изначально. Они создали сразу много страниц, но не наполнили их контентом, вроде как на будущее.

Выход вижу один - попробуйте в автоматическом режиме создать sitemap.xml - он найдёт все ваши страницы, а там уже решите, что заполнить текстом, а что просто удалить.. :)

vold57

go.seo, ну а сколько вообще страниц на сайте? 100, 1000, 10 000, и т.д.?
Может страницы на которых нет контента имеют какие-то характерные черты? Возможно, у них, в отличие от других страниц, не заполнены тайтлы, дескрипшны, кейворд. Может они без заголовка H1. А все другие страницы имеют заголовок. Может еще что-то?


go.seoTopic starter

vold57, страниц всего около 200. Все перечисленное тобой на пустышках имеется. Думаю, там нет заголовков h2-h6.

ВикторияИ

Цитата: go.seo от 24-06-2017, 11:03:27страниц всего около 200

тогда Вам лучше последовать совету LOGOS, и в первую очередь заняться наполнением страниц, которые уже попали в индекс...



go.seoTopic starter

vold57, знал, что такой ответ последует, но задач таких много, и не хочется столько времени тратить на ручную проверку.  ???