Левые урлы индексируются

Автор CLASSIK, 13-02-2016, 20:31:55

« назад - далее »

CLASSIKTopic starter

Народ помогите.
НЕ знаю почему на блоге индексируются левые урлы
например http://in4wp.ru/o-chem-pisat-v-bloge/9223372036854775750/
что за йо-майо...
этот подозрительный длинный набор чисел мне не знаком.
  •  


borzoid

Цитата: CLASSIK от 13-02-2016, 20:31:55
Народ помогите.
НЕ знаю почему на блоге индексируются левые урлы
например http://in4wp.ru/o-chem-pisat-v-bloge/9223372036854775750/
что за йо-майо...
этот подозрительный длинный набор чисел мне не знаком.
Все просто на неприличия.
1. Страница доступна, потому что неграмотно настроен сайт. Должно быть 404
2. Индексируется, потому что доступно по этому урлу и кто-то поставил ссылочку или глюк.
3. Купит сейчас на ваш сайт 1000 ссылок на разные урлы по 20 коп. каждая и все странцы в индекс попадут :)


CLASSIKTopic starter

borzoid, 404страница присутствует, в том то и дело
  •  

borzoid

Цитата: CLASSIK от 14-02-2016, 00:09:25
borzoid, 404страница присутствует, в том то и дело
Вопрос тогда в чем?
Есть урл http://in4wp.ru/o-chem-pisat-v-bloge/9223372036854775750/ с контентом. Он в индексе. Что вас не устраивает?
Если урл не тот, а лишь дубль, то 404 работает неверно.

CLASSIKTopic starter

borzoid, ну давайте рассуждать логически, что меня может не устраивать :)
Я удивлен что это с первого поста не ясно.

Конечно и ребенку понятно, что это дубль.
И совершенно понятно, что это не нормально. Вопрос "что вас не устраивает" лучше проигнорирую.
404 - до сегодняшнего дня работал нормально уже год как, наверное. С чего бы он сейчас перестал работать нормально?
Следовательно виновность с 404 страницы можно снять.
Давайте копать глубже, если не лень.

Вопрос в том - откуда эта страница вообще взялась? Может у кого-то были подобные прецеденты?
Её никто не создавал, она никуда не ведет, но, сцуко, индексируется.

Может быть это вирусня, может быть это плагин какой-то?
Я собственно поэтому и обратился на форум, чтобы помог кто-нибудь разобраться.

CMS Wordpress

  •  


borzoid

CLASSIK,
Так и надо было сказать. Из первого поста не было полной информации, а гадать нет желания. Если хотите, чтобы помогли, то надо точнее формулировать и не грубить.
1) Раз это дубль и если он единичный, то можно убрать простым 301 редиректом и уж ни в коем случае запретом в роботс (иначе он навечно останется в индексе гугла
2) Откуда страница взялась - вам виднее :) Блог то ваш. Если не вы делали, то скорее всего плагин, едва ли вирусняк, у них обычно другие задачи
3) Советую весь сайт протрясти на подобную хрень и по результатам смотреть, что делать дальше. Повторю, если это единичная страница, то решаем 301 редиректом   

CLASSIKTopic starter

  •  

borzoid

Цитата: CLASSIK от 14-02-2016, 00:26:42
А если не единичная?
Смотреть тогда движок и искать причину. Может и плагин какой то насиропил или еще кто-то. Потом наляпают кучу дублей со ссылками исходящими и тогда дело труба, не будете же гонятся за каждым дублем с 301. Я бы еще ссылочный профиль на себя глянул. Если есть ссылки на эти дубли, то кто-то пакостит. Я встречался с таким


CLASSIKTopic starter

Странные вещи происходят.

http://in4wp.ru/werwer - 404 работает.
http://in4wp.ru/chem-pablik-otlichaetsya-ot-gruppy-vkontakte/123123213 - 404 не работает.

+ двoйной каноникал...
https://yadi.sk/i/EzMHFwruooAfW



  •  


shevan

CLASSIK, у вас хороший блог.

Насчет проблемы, есть вероятность, что из-за многостраничных записей и комментариев.
Почитайте вот эту статью https://perishablepress.com/wordpress-infinite-duplicate-content/
там как раз подобная проблема, два способа решения вместе с кодами.
  •