PDF и HTML - дубль контента или нет?

Автор Тема: PDF и HTML - дубль контента или нет?  (Прочитано 1160 раз)

Оффлайн kerioАвтор темы

  • Бизнес оценка: (0)
  • Дебютант
  • *
  • СПАСИБО: 0
  • Сообщений: 4
  • Карма: 0
    • Просмотр профиля

Оффлайн kerioАвтор темы

  • Дебютант
  • *
1
Просветите, пожалуйста, как поисковики реагируют на дубли на одном сайте одного материала в форме pdf и html?

Есть Wordpress сайт, на котором много статей в pdf. Для теста перевел десяток pdf в html, не удаляя оригинальные pdf. Дало резкое увеличение траффика, за счет роста траффика с поисковиков на html, но и траффик на pdf так и не пропал за несколько месяцев. Канонических ссылок не прописывал. Сломал голову, отчего так происходит, ведь по идее это дубль контента и в теории поисковики такое не любят. Возможно, кому–то интересно читать именно в pdf и они кликают на них в поиске? Возможно дело в том, что description и title у pdf и html отличаются?

Значит ли это, что поисковики нормально относятся к дублям материалов в разном формате, и при переводе статей в html не надо удалять оригинальные pdf? Или же должно пройти больше времени, чем несколько месяцев, чтобы траффик на pdf срезался?


Оффлайн Sky-fi

  • Глобальный модератор
  • Бизнес оценка: (9, 100%)
  • *****
  • СПАСИБО: 3586
  • Сообщений: 5030
  • Карма: 324
  • Пол: Мужской
  • Search Engine Marketing
  • Награды Мастер поисковой оптимизации Более одной тысячи спасибо
    • Просмотр профиля
    • Блог про SEO

Оффлайн Sky-fi

  • Глобальный модератор
  • *****
  • Доп. информация
    • Бизнес оценка: (9, 100%)
    • СПАСИБО: 3586
    • Сообщений: 5030
    • Карма: 324
    • Пол: Мужской
    • Search Engine Marketing
    • Награды Мастер поисковой оптимизации Более одной тысячи спасибо
      • Просмотр профиля
      • Блог про SEO
Re: PDF и HTML - дубль контента или нет?
« Ответ #1 : 11-04-2018, 19:22:30 »
А вы проверяли трафик в аналитиксе? Нет отличий по каким-то характерным признакам?
Моя рекомендация, раз все так хорошо - сделайте еще десяток, подождите 2-4 месяца, если трафик поднимется - продолжайте в том же духе.
Но в теории html файлы не имеют особых отличий от pdf или привилегий в ранжировании. Так что если поднялся трафик по тем же запросам, pdf файлы должны просесть.
Похоже на то, что у вас пдф и хтмл попадают в топ по разным запросам, потому и увеличивается трафик.
Комплексный SEO аудит. Внутренняя оптимизация. Поисковое продвижение.
Skype: zagorovets90

Оффлайн #vikup34

  • Бизнес оценка: (0)
  • Старожил
  • ****
  • СПАСИБО: 209
  • Сообщений: 349
  • Карма: 31
    • Просмотр профиля
    • срочный выкуп недвижимости

Оффлайн #vikup34

  • Старожил
  • ****
Re: PDF и HTML - дубль контента или нет?
« Ответ #2 : 11-04-2018, 21:54:04 »
подписываюсь на тему...

любопытный момент. Заинтересовало.

Оффлайн Coder

  • Бизнес оценка: (0)
  • Ветеран
  • *****
  • СПАСИБО: 558
  • Сообщений: 847
  • Карма: 45
  • Пол: Мужской
  • Qui dicit eam omnia
    • Просмотр профиля
    • Coder hol es

Оффлайн Coder

  • Ветеран
  • *****
  • Доп. информация
    • Бизнес оценка: (0)
    • СПАСИБО: 558
    • Сообщений: 847
    • Карма: 45
    • Пол: Мужской
    • Qui dicit eam omnia
      • Просмотр профиля
      • Coder hol es
Re: PDF и HTML - дубль контента или нет?
« Ответ #3 : 11-04-2018, 21:59:49 »
Несмотря на дату...
Цитировать
Вопрос: Рассматривается ли существование страниц как в HTML, так и в PDF как дублирование контента?

Ответ: Насколько это возможно, мы рекомендуем предоставление единственной копии контента. Если это невозможно, убедитесь, что вы указали предпочтительную версию, например, указав предпочтительную URL в Sitemap или определив каноническую версию в HTML или HTTP заготовках PDF.
_https://www.searchengines.ru/faq_google.html

Оффлайн kerioАвтор темы

  • Бизнес оценка: (0)
  • Дебютант
  • *
  • СПАСИБО: 0
  • Сообщений: 4
  • Карма: 0
    • Просмотр профиля

Оффлайн kerioАвтор темы

  • Дебютант
  • *
Re: PDF и HTML - дубль контента или нет?
« Ответ #4 : 13-04-2018, 22:03:48 »
Спасибо большое за ответ! Я очень долго пытался на форумах получить какие-то соображения на эту тему, но везде ничего внятного.

Прошу прощения за паузу с собственным ответом.

По ранжированию pdf - несмотря на официальные утверждения, что они ранжируются одинаково с pdf это не похоже на правду. Во-первых, у них меньше настроек. Во-вторых, и те настройки, что есть у pdf, вряд ли кто будет заполнять (скажем, вбивать вменяемые названия картинок и тому подобное), так как по факту делают их люди, не понимающие задач SEO. В-третьих, yandex тупо открывает pdf в браузере, не переводя на сайт (даже если pdf встроен в какую-то из его страниц). Т.е. теряется брендинг сайта, теряется возможность конверсии в подписчиков, глубина просмотра и так далее. В-четвертых, у pdf из-за специфики сайта нельзя прописать человеческие и интересные description, а у html можно, это даёт ощутимый скачок в росте. Но судя по тестам (хотя и с маленькой выборкой) даже перевод в html с тем же описаниям даёт некоторый выигрыш.

Попробовал выявить разницу через аналитикс - слишком мелкая выборка. Похоже, что в первую очередь разница за счет нормальных title\description.

Спасибо на faq от гугла, не видел этой информации.


Оффлайн Coder

  • Бизнес оценка: (0)
  • Ветеран
  • *****
  • СПАСИБО: 558
  • Сообщений: 847
  • Карма: 45
  • Пол: Мужской
  • Qui dicit eam omnia
    • Просмотр профиля
    • Coder hol es

Оффлайн Coder

  • Ветеран
  • *****
  • Доп. информация
    • Бизнес оценка: (0)
    • СПАСИБО: 558
    • Сообщений: 847
    • Карма: 45
    • Пол: Мужской
    • Qui dicit eam omnia
      • Просмотр профиля
      • Coder hol es
Re: PDF и HTML - дубль контента или нет?
« Ответ #5 : 13-04-2018, 22:05:11 »
Спасибо на faq от гугла, не видел этой информации.

)Пожалуйста

Оффлайн alexakap

  • Бизнес оценка: (0)
  • Постоялец
  • ***
  • СПАСИБО: 69
  • Сообщений: 214
  • Карма: 11
  • Пол: Мужской
    • Просмотр профиля

Оффлайн alexakap

  • Постоялец
  • ***
Re: PDF и HTML - дубль контента или нет?
« Ответ #6 : 13-04-2018, 22:37:25 »
pdf очень интересная тема и я активно использую при продвижении сайтов некоторые фишки, связанные с pdf документами. Гугл отлично понимает содержимое документов и хорошо их индексирует. Яндекс вряд ли понимает содержимое и плохо индексирует эти документы. pdf и html в принципе могут существовать в поисковиках на равных правах, но в pdf нельзя указать например альты картинок, сделать микроразметку заголовков, дат, цен и другого текста. Т.е. какие то важные параметры ранжирования страницы отпадают. Поэтому для CЧ и ВЧ запросов нет смысла делать pdf. По вопросу дублей. Гугл может выдать в ВМ ошибку по дублю тайтла, если у pdf и html документа они совпадают, других ошибок не видел

Оффлайн kerioАвтор темы

  • Бизнес оценка: (0)
  • Дебютант
  • *
  • СПАСИБО: 0
  • Сообщений: 4
  • Карма: 0
    • Просмотр профиля

Оффлайн kerioАвтор темы

  • Дебютант
  • *
Re: PDF и HTML - дубль контента или нет?
« Ответ #7 : 15-04-2018, 01:04:26 »
О, спасибо большое за реальный опыт! Очень интересно, что единственной ошибкой на практике было совпадение в тайтле.

Оффлайн zanuda

  • Бизнес оценка: (0)
  • Ветеран
  • *****
  • СПАСИБО: 429
  • Сообщений: 1422
  • Карма: 47
    • Просмотр профиля

Оффлайн zanuda

  • Ветеран
  • *****
Re: PDF и HTML - дубль контента или нет?
« Ответ #8 : 16-04-2018, 10:37:41 »
я активно использую при продвижении сайтов некоторые фишки, связанные с pdf документами
А поподробнее можно? Типа, что в pdf можно линки вставлять и таким образом поиметь бэклинки, знаю. Что-то еще?


Оффлайн alexakap

  • Бизнес оценка: (0)
  • Постоялец
  • ***
  • СПАСИБО: 69
  • Сообщений: 214
  • Карма: 11
  • Пол: Мужской
    • Просмотр профиля

Оффлайн alexakap

  • Постоялец
  • ***
Re: PDF и HTML - дубль контента или нет?
« Ответ #9 : 16-04-2018, 10:54:16 »
А поподробнее можно? Типа, что в pdf можно линки вставлять и таким образом поиметь бэклинки, знаю. Что-то еще?
Ну да, т.к. pdf тырят не ура, делаю документ под СЧ/НЧ запрос не высокой конкурентности и ставлю несколько анкорных ссылок на свои ключи. Документы расходятся как горячие пирожки. Особенно технические и нормативные документы


 

Похожие темы