Как удалить ненужные индексы из гугл навсегда?

Автор Тема: Как удалить ненужные индексы из гугл навсегда?  (Прочитано 1891 раз)

Оффлайн diamond_miledyАвтор темы

  • Бизнес оценка: (0)
  • Старожил
  • ****
  • СПАСИБО: 175
  • Сообщений: 253
  • Карма: 9
  • Пол: Женский
  • Людмила
  • Награды Более 100 спасибо
    • Интерьер+

Оффлайн diamond_miledyАвтор темы

  • Старожил
  • ****
  • Доп. информация
    • Бизнес оценка: (0)
    • СПАСИБО: 175
    • Сообщений: 253
    • Карма: 9
    • Пол: Женский
    • Людмила
    • Награды Более 100 спасибо
      • Интерьер+
Здравствуйте, форумчане! Может, кто подскажет, как с этим справиться?

Когда-то по неопытности наделала ошибок (свой движок) - до сих пор не могу разгрести. Неправильно проиндексированные страницы никак не могу удалить навсегда.

Удаляю в вебмастере - через некоторое время опять появляются. Опять удаляю - опять появляются. И так до бесконечности.

Закрытые в robots.txt страницы теперь в поиске выдает в виде URL-адреса, они не исчезают.

Вот так выглядят:
www.interier-nn.ru/catalog.php?id_vid=0&id_tip=0&i...
Описание веб-страницы недоступно из-за ограничений в файле robots.txt.


Особенно бесят адреса с пробелами - вообще не могу удалить!!!

Ну как навсегда удалить из гугл? В яндексе все просто, а здесь... ППЦ! Достали прям! Болтаются в поиске лишние дубли...  >:D
Свой интернет-магазин строительных отделочных материалов http://interier-nn.ru/. Самые низкие цены в Нижнем Новгороде.


Оффлайн Clever

  • Бизнес оценка: (7, 100%)
  • Ветеран
  • *****
  • СПАСИБО: 494
  • Сообщений: 965
  • Карма: 87
  • Пол: Мужской
  • Награды КМС поисковой оптимизации

Оффлайн Clever

  • Ветеран
  • *****
В Google страницы или категории удаляются через удалить url:

https://www.google.com/webmasters/tools/url-removal?hl=ru&siteUrl=www.interier-nn.ru

Оффлайн Reistlin

  • Бизнес оценка: (0)
  • Рекрут
  • *
  • СПАСИБО: 13
  • Сообщений: 24
  • Карма: 3

Оффлайн Reistlin

  • Рекрут
  • *
Здравствуйте, форумчане! Может, кто подскажет, как с этим справиться?

Когда-то по неопытности наделала ошибок (свой движок) - до сих пор не могу разгрести. Неправильно проиндексированные страницы никак не могу удалить навсегда.

Удаляю в вебмастере - через некоторое время опять появляются. Опять удаляю - опять появляются. И так до бесконечности.

Закрытые в robots.txt страницы теперь в поиске выдает в виде URL-адреса, они не исчезают.

Вот так выглядят:
www.interier-nn.ru/catalog.php?id_vid=0&id_tip=0&i...
Описание веб-страницы недоступно из-за ограничений в файле robots.txt.


Особенно бесят адреса с пробелами - вообще не могу удалить!!!

Ну как навсегда удалить из гугл? В яндексе все просто, а здесь... ППЦ! Достали прям! Болтаются в поиске лишние дубли...  >:D
А это копии страниц? Если да, то можно склеить с нормальными (301 редирект), если нет - сделать перенаправление на ошибку 404.

Оффлайн diamond_miledyАвтор темы

  • Бизнес оценка: (0)
  • Старожил
  • ****
  • СПАСИБО: 175
  • Сообщений: 253
  • Карма: 9
  • Пол: Женский
  • Людмила
  • Награды Более 100 спасибо
    • Интерьер+

Оффлайн diamond_miledyАвтор темы

  • Старожил
  • ****
  • Доп. информация
    • Бизнес оценка: (0)
    • СПАСИБО: 175
    • Сообщений: 253
    • Карма: 9
    • Пол: Женский
    • Людмила
    • Награды Более 100 спасибо
      • Интерьер+
А это копии страниц? Если да, то можно склеить с нормальными (301 редирект), если нет - сделать перенаправление на ошибку 404.

Есть копии, есть не копии. Их много. Замучаешься редиректить. 
Ну вот у меня настроен редирект www -> без www, и все равно всплывают страницы с www. Никакой редирект не помогает.

Даже индексы, которые дают ошибку 404, все равно не удаляются.
Просто кошмар какой-то. С Яндексом таких проблем нет.

А как сделать перенаправление на ошибку 404? Напишите пример.
« Последнее редактирование: 13-05-2015, 15:59:29 от diamond_miledy »
Свой интернет-магазин строительных отделочных материалов http://interier-nn.ru/. Самые низкие цены в Нижнем Новгороде.

Оффлайн Reistlin

  • Бизнес оценка: (0)
  • Рекрут
  • *
  • СПАСИБО: 13
  • Сообщений: 24
  • Карма: 3

Оффлайн Reistlin

  • Рекрут
  • *
Есть копии, есть не копии. Их много. Замучаешься редиректить. 
Ну вот у меня настроен редирект www -> без www, и все равно всплывают страницы с www. Никакой редирект не помогает.

Даже индексы, которые дают ошибку 404, все равно не удаляются.
Просто кошмар какой-то. С Яндексом таких проблем нет.

А как сделать перенаправление на ошибку 404? Напишите пример.

Пишем скрипт на php/js и редиректим все автоматом. Всплывают страницы, т.е - всплывают в поиске google или по факту входа на сайт? Может, google тупо не переиндексировал страницы?
Вот пример перенаправления на страницу ошибки 404 через php:
<?php
   header('HTTP/1.1 404 Not Found');
   exit("<meta http-equiv='Refresh' content='0; URL=http://mysite.com/404.php'>");
?>


Оффлайн diamond_miledyАвтор темы

  • Бизнес оценка: (0)
  • Старожил
  • ****
  • СПАСИБО: 175
  • Сообщений: 253
  • Карма: 9
  • Пол: Женский
  • Людмила
  • Награды Более 100 спасибо
    • Интерьер+

Оффлайн diamond_miledyАвтор темы

  • Старожил
  • ****
  • Доп. информация
    • Бизнес оценка: (0)
    • СПАСИБО: 175
    • Сообщений: 253
    • Карма: 9
    • Пол: Женский
    • Людмила
    • Награды Более 100 спасибо
      • Интерьер+
Пишем скрипт на php/js и редиректим все автоматом. Всплывают страницы, т.е - всплывают в поиске google или по факту входа на сайт? Может, google тупо не переиндексировал страницы?
Вот пример перенаправления на страницу ошибки 404 через php:
<?php
   header('HTTP/1.1 404 Not Found');
   exit("<meta http-equiv='Refresh' content='0; URL=http://mysite.com/404.php'>");
?>

Спасибо, понятно (буду иметь ввиду), но мне это не подходит.

Индексы я просматриваю вручную: site:interier-nn.ru (перехожу в конец ->Показать скрытые результаты и смотрю, чего он навалял там)

Потом смотрю site:www.interier-nn.ru


Вот такой дурацкий индекс с пробелами не могу удалить (регулярно появляются в такими пробелами, которые заменятся символом %):
сайт/catalog.php?id_vid=0&id_tip=0&id_class=0&id_name=0&width=1400%2527

И еще бесит: гугл индексирует страницы, на которых указано <meta name='robots' content='noindex, nofollow'/>
И ведь переходы на эти страницы только через JS:  document.location.href=...
И не могу их удалить никак.
« Последнее редактирование: 13-05-2015, 16:20:02 от diamond_miledy »
Свой интернет-магазин строительных отделочных материалов http://interier-nn.ru/. Самые низкие цены в Нижнем Новгороде.

Оффлайн Reistlin

  • Бизнес оценка: (0)
  • Рекрут
  • *
  • СПАСИБО: 13
  • Сообщений: 24
  • Карма: 3

Оффлайн Reistlin

  • Рекрут
  • *
Спасибо, понятно (буду иметь ввиду), но мне это не подходит.

Индексы я просматриваю вручную: site:interier-nn.ru (перехожу в конец ->Показать скрытые результаты и смотрю, чего он навалял там)

Потом смотрю site:www.interier-nn.ru


Вот такой дурацкий индекс с пробелами не могу удалить (регулярно появляются в такими пробелами, которые заменятся символом %):
сайт/catalog.php?id_vid=0&id_tip=0&id_class=0&id_name=0&width=1400%2527

И еще бесит: гугл индексирует страницы, на которых указано <meta name='robots' content='noindex, nofollow'/>
И ведь переходы на эти страницы только через JS:  document.location.href=...
И не могу их удалить никак.
А что подходит? Я вот точно не знаю (не тестировал), но можно попробовать вот так (через html):
<meta http-equiv="refresh" content="0;URL='http://mysite.com/404.php/html'">
Попробуйте настроить на 1 страницу и посмотрите, какую сообщуху отдает сервер)

Оффлайн vold57

  • Бизнес оценка: (6, 100%)
  • Мастер
  • *****
  • СПАСИБО: 5231
  • Сообщений: 7195
  • Карма: 285
  • Пол: Мужской
  • Награды Более трех тысяч спасибо Мастер поисковой оптимизации
    • SEO, интернет-маркетинг, сайостроение

Оффлайн vold57

  • Мастер
  • *****
И еще бесит: гугл индексирует страницы, на которых указано <meta name='robots' content='noindex, nofollow'/>
Если в robots.txt запретили сканирование страницы, то Гугл этого <meta name='robots' content='noindex, nofollow'/> и не видит. Во всяком случае, идет вам навстречу и делает вид, что не видит.


Оффлайн diamond_miledyАвтор темы

  • Бизнес оценка: (0)
  • Старожил
  • ****
  • СПАСИБО: 175
  • Сообщений: 253
  • Карма: 9
  • Пол: Женский
  • Людмила
  • Награды Более 100 спасибо
    • Интерьер+

Оффлайн diamond_miledyАвтор темы

  • Старожил
  • ****
  • Доп. информация
    • Бизнес оценка: (0)
    • СПАСИБО: 175
    • Сообщений: 253
    • Карма: 9
    • Пол: Женский
    • Людмила
    • Награды Более 100 спасибо
      • Интерьер+
А что подходит? Я вот точно не знаю (не тестировал), но можно попробовать вот так (через html):
<meta http-equiv="refresh" content="0;URL='http://mysite.com/404.php/html'">
Попробуйте настроить на 1 страницу и посмотрите, какую сообщуху отдает сервер)

Мне надо, чтобы страницы на сайте присутствовали (листание по страницам), но в индексе не были.

Я и в роботсе их закрыла, и в метатеге указала noindex... и ссылок на сайте на них нет. Но все равно индексы болтаются... Не удаляются...

Гугл дебильный какой-то :'(

Добавлено: 13-05-2015, 19:34:57

Если в robots.txt запретили сканирование страницы, то Гугл этого <meta name='robots' content='noindex, nofollow'/> и не видит. Во всяком случае, идет вам навстречу и делает вид, что не видит.



В том-то и дело, что не удаляет запрещенные в роботсе страницы, а в выдаче выдает URL с указанием Описание веб-страницы недоступно из-за ограничений в файле robots.txt.

Пример: напишите в поиске гугл site:www.interier-nn.ru и сами увидите
« Последнее редактирование: 13-05-2015, 19:34:57 от diamond_miledy »
Свой интернет-магазин строительных отделочных материалов http://interier-nn.ru/. Самые низкие цены в Нижнем Новгороде.


Оффлайн vold57

  • Бизнес оценка: (6, 100%)
  • Мастер
  • *****
  • СПАСИБО: 5231
  • Сообщений: 7195
  • Карма: 285
  • Пол: Мужской
  • Награды Более трех тысяч спасибо Мастер поисковой оптимизации
    • SEO, интернет-маркетинг, сайостроение

Оффлайн vold57

  • Мастер
  • *****
В том-то и дело, что не удаляет запрещенные в роботсе страницы
Я же вам написал, почему не удаляет. Уберите запрет на сканирование в robots.txt и дайте возможность Гуглу прочитать в хедере страницы запрет на индексацию - <meta name='robots' content='noindex, nofollow'/>.

Вам и выдача подсказывает, что Гугл не видит содержимое страницы:
Описание веб-страницы недоступно из-за ограничений в файле robots.txt.

« Последнее редактирование: 13-05-2015, 19:45:55 от vold57 »


 

Похожие темы

  Тема / Автор Ответов Последний ответ
0 Ответов
918 Просмотров
Последний ответ 02-01-2012, 16:33:16
от Sarpedon
2 Ответов
1289 Просмотров
Последний ответ 18-02-2012, 00:20:08
от cyclop
4 Ответов
1544 Просмотров
Последний ответ 01-09-2014, 11:21:45
от Chiliec
3 Ответов
3948 Просмотров
Последний ответ 19-03-2016, 14:28:24
от ErikKartman
0 Ответов
94 Просмотров
Последний ответ 13-05-2020, 09:12:25
от brigabos