Как Google сможет определять временный контент

Автор Тема: Как Google сможет определять временный контент  (Прочитано 1441 раз)

Оффлайн Владимир75Автор темы

  • Администратор
  • Бизнес оценка: (4, 100%)
  • *****
  • СПАСИБО: 7203
  • Сообщений: 10612
  • Карма: 648
  • Пол: Мужской
  • Это я такой уже старый
  • Награды Гроссмейстер поисковой оптимизации SEO Профессионал Более трех тысяч спасибо За благотворительность Почетный гражданин нашего форума
    • Просмотр профиля
    • Оптимизация и Продвижение

Оффлайн Владимир75Автор темы

  • Администратор
  • *****
  • Доп. информация
    • Бизнес оценка: (4, 100%)
    • СПАСИБО: 7203
    • Сообщений: 10612
    • Карма: 648
    • Пол: Мужской
    • Это я такой уже старый
    • Награды Гроссмейстер поисковой оптимизации SEO Профессионал Более трех тысяч спасибо За благотворительность Почетный гражданин нашего форума
      • Просмотр профиля
      • Оптимизация и Продвижение
Еще в 2007 году я писал свои мысли по поводу того, как Yahoo! может сканировать веб-сраницы, а затем повторно еще раз сканировать примерно через минуту, чтобы увидеть, изменились ли какие-нибудь ссылки. Возможно, это делалось для того, чтобы попытаться определить так называемые «временные ссылки», которые могут меняться при каждом посещении страницы. И это такие ссылки, которые поисковая система не хотела бы сканировать и индексировать.


Google получил на этой неделе патент на подобную тему, которая видит «временный» контент на веб-страницах. Хотя такое содержание может включать в себя рекламу, она также может включать и, например, текущий прогноз погоды. Такое содержание изменяется на регулярной основе, но часто мало имеет общего с материалом, найденным в другом месте данной страницы.


Google хочет уметь идентифицировать временный контент, чтобы не индексировать страницы, основанные на нем, и также он не будет показывать рекламные объявления.
Содержание и признаки.


Вместо того, чтобы просматривать ссылки на страницах, как делает Yahoo, можно просматривать фактический html-код на странице и разбивать его на признаки. Поисковая машина может использовать теговый подход к определению каждой из отметок. Например:


Html-код страницы один день может выглядеть следующим образом:
<html><header><title>Привет</title></header><body> <h1>Первый раздел</h1> <p> <em> Сегодня воскресенье, 24 июня 2007. </em> </p> </body> </html>
А вторая версия той же страницы может быть восстановлена поисковой системой на следующий день с небольшими изменениями, например:
<html> <header> <title>Привет</title> </header> <body> <h1>Первый раздел</h1> <p> <em> Сегодня понедельник, 25 июня 2007. Прогноз погоды: солнечно. </em> </p> </body> </html>
Поисковая система может разделить разметку для первой версии веб-страницы следующим образом:


     <html>
    <header>
    <title>
    Привет
    </title>
    </header>
    <body>
    <h1>
     Первый раздел
    </h1>
    <p>
    <em>
    Сегодня воскресенье, 24 июня 2007.
    </em>
    </p>
    </body>
    </html>


И может разделить разметку во второй день с очень похожими признаками:


    <html>
    <header>
    <title>
     Привет
    </title>
    </header>
    <body>
    <h1>
    Первый раздел
    </h1>
    <p>
    <em>
    Сегодня понедельник, 25 июня 2007.
    Прогноз погоды: солнечно.
    </em>
    </p>
    </body>
    </html>


Все это может быть обработано так, что будет находиться в таблице данных и их можно сравнить быстро, чтобы увидеть, что изменилось, а что нет.


Google может использовать эти сравнения, чтобы определить, что часть содержимого изменяется регулярно, но не влияет на содержание страницы в целом. А если влияет, то поисковик может решить, что содержание временное.


Google может также посмотреть, в какой части html появляется подобное содержание на страницах сайта, чтобы попытаться найти временный контент, который может снова возникнуть на нескольких страницах. Html «путь» может быть, например, <html>><body><div><ul><li>, а такое специфическое содержание может появится после определенного количества открытых html-тегов. Если содержание было определено как «временное», то появляется определенный «путь» на одной странице, а ряд других страниц с таким же сочетанием html-тегов, контент на этих страницах, будут проанализированы, чтобы определить, также ли это временный контент.


Информацию о данном патенте можете посмотреть здесь.
Выводы:


Google может также искать шаблонное содержимое на странице, которое часто одинаково на более чем одной странице сайта, а может быть одинаковым и для всех страниц. Это шаблонная информация может содержать уведомления об авторском праве, навигацию, текст и другую информацию в сайдбарах, подвале и шапке сайта. Шаблонная информация не может нести такой же вес, как основное содержание, которое меняется от страницы к странице, когда речь идет об индексации контента. В отличие от шаблонного, «временный» контент может меняться от одного визита поисковой системы к другому, и может также легко содержаться как в основном содержимом, так и в других разделах (шапка, подвал или сайдбары). Оно может включать, например, время и информацию о погоде или рекламные объявления, или другое содержимое, которое необязательно будет связано с контентом на странице, который остается неизменным от визита к визиту.


Временный контент может быть также контентом, актуальным для остального содержимого на определенной странице, и весь вопрос в том, как Google будет относиться к этому.


Я уверен, что есть, вероятно, способы отличить контент, например, прогноз погоды, который может обновляться ежедневно, от рекомендуемых описаний продуктов, которые могли бы обновлять ссылку на более глубокие страницы сайта ежедневно или ежечасно. Но патент не очень легко находит отличия между разными типами контента. У некоторых сайтов есть особенный контент, например, обновляемые отзывы или обновляемые цитаты и определения, которые могут меняться случайным образом, и нет никаких утверждений от Google о том, как этот патент будет справляться с этим.


Если контент включает в себя ссылки на рекомендации товаров, и те являются случайными или быстро обновляемыми, это может увеличить вероятность того, что Google примет это за «временный контент». Если вы хотите показывать отзывы и хотите, чтобы они индексировались, лучшим бы выходом стал показ некоторых постоянных отзывов вместе со ссылкой на полную страницу отзывов.


Конечно, это не очень трудно проверить данные вещи, если у вас есть время и желание. Мы не знаем, реализовал ли Google этот подход ко «временному» контенту, и если да, то какие ограничения он использует.


Патент также не говорит о новостных сайтах или блогах, которые могли бы использовать очень похожие html-«пути» к контенту страницы, но есть, вероятно, способы отличить такой тип «временного» контента от действительно временного.
Первоисточник:Источник

Источник перевода





« Последнее редактирование: 28-01-2012, 12:11:54 от Владимир75 »
Seo-консультации по SkypeSeo и разработка сайтов, Облачный майнинг(Блокчейн)
Skype:service-advertising(без live)
Мобильный, Whatsap, Viber: 8(910)774-44-99


 

Похожие темы

  Тема / Автор Ответов Последний ответ
7 Ответов
2819 Просмотров
Последний ответ 31-05-2010, 11:20:37
от Snork
0 Ответов
1034 Просмотров
Последний ответ 27-06-2012, 17:55:59
от MoJo
4 Ответов
2654 Просмотров
Последний ответ 30-01-2014, 09:52:26
от _denis
2 Ответов
2085 Просмотров
Последний ответ 05-01-2015, 19:21:17
от ВикторияИ
0 Ответов
2119 Просмотров
Последний ответ 29-06-2016, 17:51:16
от Knyazev