Частична деиндексация на сайт

Странникът

Well-Known Member
Искам да деиндексирам старото съдържание на един сайт, който е на Уордпрес. Каквото е било досега в него – било. Повече няма да ползвам вече съществуващата база данни, съществуващите статии, нищо не ме интересува от миналото на сайта. Желая неговото съдържание да бъде деиндексирано и премахнато от Гугъл. Но за целта не мога да ползвам в сайта метата noindex, nofollow, защото ще продължа да работя по сайта. Ще направя нова база данни, ще има ново съдържание, сайта ще тръгне по нов път.
Какъв е начина да постигна това? Частична деиндексация на старото съдържание на работещ сайт?

Старите адреси на сайта за статии, категории са смесени, на латиница и кирилица, по този начин направени: site.com/име-на-статия.
Новите адреси които ще ползвам в сайта са дефолтните за уордпрес.

Предполагам това може да стане с robots.txt, но не знам как да направя това разделяне.
 
От: Частична деиндексация на сайт

В гугъл уебмастерс туулс -> Оптимизация -> Премахване на URL адреси
 
От: Частична деиндексация на сайт

В гугъл уебмастерс туулс -> Оптимизация -> Премахване на URL адреси

Над 5 000 съществуващи адреси. Ръчно ли да ги премахна или може всички наведнъж?
 
От: Частична деиндексация на сайт

Не знам структурирането на адреси на Wp, защото не работя с него, но има ли възможност да направиш категория, която да не е достъпна за никой? Ако има такава възможност, премести там всички статии, които няма да са нужни повече и в htaccess си направи един редирект на 404 към началната страница. След време ще изчезнат от индекса.
 
От: Частична деиндексация на сайт

е 5000 линка са доста :) прочети правилата за деиндексиране чрез robots.txt и дано някой от вариантите ти свърши работа.
 
От: Частична деиндексация на сайт

Чел съм го, и там нещо не ми е ясно и трябва да питам.
 
От: Частична деиндексация на сайт

с мета роботс май няма как да стане за всички адреси
 
Последно редактирано:
От: Частична деиндексация на сайт

Ето това намерих за твоя случай: hжжp://support.google.com/webmasters/bin/answer.py?hl=en&answer=35843
 
От: Частична деиндексация на сайт

Намерих начин и успях да направя всички адреси в robots.txt. Ще преместя сайта в една папка, и там ще забраня и нейното индексиране. Само едно ме притеснява, че макар и вече да съм указал всички досега съществуващи адреси да се деиндексират, то все пак ще дават 404 грешка. Това ще бъде ли проблем или е нужно да направя и нещо друго?
 
От: Частична деиндексация на сайт

Не ми се вярва по този начин да ги индексира. Всъщност твоят сайт може да не се класира вече и да липсва при търсене, но по същите думи, откъдето е успял да докопа линк ще се класират други сайтове, и те ще водят към теб при грешен адрес с липсващо съдържание 404, което вече не се сещам как може да бъде избегнато. Аз смених преди няколко години структурата на един мой wp сайт и все се намират хора да влизат от старите адреси, които вече са ми 404, тъй като 301 ми ги отчита като "непроследени" (каквото и да означава това), макар и правилно насочени. Мисля, че е достатъчно да оставиш да се индексира новия, а бота ще се усети и ще направи останалото.
 
От: Частична деиндексация на сайт

Инсталираш този плъгин - http://wordpress.org/extend/plugins/404-redirection/ на новия блог. Това което прави е да насочва(301 redirect) всички несъществуващи страници, които връщат 404 към индекса. Така запазваш link juice ако случайно има линкове към някоя от вътр. станици и казваш на Google, че страниците са преместени. Постепенно Google ще деиндексира старите страници. Преди 2-3 седмици взех домейн с 6000+ индексирани страници и в момента са към 1000 в индекса. Действа на 100%.
 

Горе