Помощ за странни адреси в GWT.

toniintro

Active Member
Здравейте,
Имам нужда от помощ по повод странни адреси, които GWT от 1 седмица ми трупа като грешки при обхождане. Примерен адрес е:

Някой има ли представа откъде може да се появяват тия глупости. Като гледам явно е от някой плъгин и се съмнявам дали не е Diggdigg, друг на споделяне и т.н. нямам качен, а такъв за фийд бек изобщо никога не съм слагал.
 
Последно редактирано:
От: Помощ за странни адреси в GWT.

От фейсбук коментарите е. Гугъл са сменили алгоритъма, с който индексират скриптосаните части от сайта.
А тия хубостници на Марк използват релативни урл-та и от там идва проблема.
 
Последно редактирано:
От: Помощ за странни адреси в GWT.

Забрани ги в robots.txt, примерно:

User-Agent: *
Disallow: /wp-content/plugins/

И след около месец ще изчезнат от индекса на гошо
 
От: Помощ за странни адреси в GWT.

По интелигнентно решение

RewriteCond %{REQUEST_URI} ^/plugins/feedback.php$
RewriteCond %{QUERY_STRING} ^href=http://домаин.цом/(.*)\&_fb_noscript=(\d+)$
RewriteRule ^plugins/feedback.php(.*)/?$ %1? [L,R=301]
 
Последно редактирано:
От: Помощ за странни адреси в GWT.

Записвам се за темата, че и аз имам доста подобни и се чудех дали да пусна подобна тема. Благодаря за решение с htaccess, ще го пробвам.

P.S. При мен май нещо не се получава с този код, защото може би пермалинка ми е друг, а също така кирилизиран.

Ето пример: http://сайтът.ком/plugins/feedback....0%d1%82%d0%bd%d0%b8%d0%ba.html&_fb_noscript=1
 
Последно редактирано:
От: Помощ за странни адреси в GWT.

Момчета благодаря ви за ползотворните мнения. Предполага ще пробвам с решението, което Торбалан предлага. И аз предполагах, че е нещо свързано с FB, защото забелязах последните писания в URL, но мислех, че е от плъгина за социалните бутони. Ползвам плъгин за коментари, който позволява да се коментира чрез Г+ и ФБ и явно там е грижата. Ега ти и мъката е с тя простотии. Ама така е, като не разбираш кодирането и не си ги пишеш сам.
 
От: Помощ за странни адреси в GWT.

Снощи борих един сайт дето има проблеми със процесорното време.

Та видях подобни шмекерии във лога и им набих директно един 410 да не ме занимават със глупости.
 
От: Помощ за странни адреси в GWT.

С месеци се мъча бавно, но славно да премахвам грешките.. бяха хиляди грешки от различно естество.. Тези също мога евентуално една по една да ги пренасочвам, но все пак ако някой автоматизиран вариант сработи, ще е добре дошъл..

Ако мога да помоля и за htaccess работещо кодче за пренасочване от: /archives/цифри (т.е. ID номера на публикацията) към /?p=цифри (ID номера на публикацията)

Ежедневно цъфват по няколко такива и се мъча една по една.. Не ми е пермалинка на ?p=, но тъй като то винаги работи и си е заложено в WP, затова пращам към него, а то от своя страна си препраща на правилното, т.е. правя 2 пъти автоматичен редирект. Може да не е правилно, но от всичко пробвано досега това върши работа.
 
Последно редактирано:
От: Помощ за странни адреси в GWT.

Не знам какво са си сменили гугъл, но постоянно ме изненадват с нови и нови адреси, за които даже не съм предполагал, че съществуват. Постоянно забранявам и изчиствам, но след няколко месеца решава, че трябва да индексира и да дава дублирано съдържание дори на noindex или каноникъл адреси.

Последно взе да ми показва дублирано съдържание ето така:

сайт.ком/статията

сайт.ком/m/статията

сайт.ком/mobile/статията

Като на "m" и "mobile" са с таг каноникъл и не са реално съществуващи адреси в сайта. Няма връзки към тях от менюта и никога не са създавани.
 
От: От: Помощ за странни адреси в GWT.

Тъжна вест за хората на споделен хостинг

Решение намерих, но работи само ако имате RewriteMap, което не може да се направи на ниво .htaccess.

За хората с ВПС-и базирани на червена шапка

създавате в /etc/httpd/conf.d/ файл mod_rewite.conf и в него слагате директивата
RewriteMap unescape int:unescape

service httpd restart

и в .htaccess

RewriteCond ${unescape:%{QUERY_STRING}} ^href=http://domain.com/(.*)\&_fb_noscript=(\d+)$
RewriteRule ^plugins/feedback.php(.*)/?$ %1? [L,R=301,NE]
 
Последно редактирано:
От: Помощ за странни адреси в GWT.

И Г+ коментарите, по-скоро споделяния, ми ги дава като "Друго" (грешки) 400. То т'ва няма оправия. Някой да репортва за тия проблеми или кажете откъде може да го правим всеобщо, за да се обърне внимание на тях, и техните програмисти да решат своевременно проблема, ако е възможно..

Пример: (с връзка от..)
https:// plus.google.com/wm/1/голямо число/posts/поредица от символи
https:// apis.google.com/wm/1/същото голямо число/posts/същата поредица от символи (главни + малки букви + цифри)
 
От: От: Помощ за странни адреси в GWT.

По интелигнентно решение

RewriteCond %{REQUEST_URI} ^/plugins/feedback.php$
RewriteCond %{QUERY_STRING} ^href=http://домаин.цом/(.*)\&_fb_noscript=(\d+)$
RewriteRule ^plugins/feedback.php(.*)/?$ %1? [L,R=301]

Искам да питам, дали правилно съм го поместил в .hatccess файла? А именно:

<ifmodule mod_expires.c>
RewriteCond %{REQUEST_URI} ^/plugins/feedback.php$
RewriteCond %{QUERY_STRING} ^href=http://www.домейна.com/(.*)\&_fb_noscript=(\d+)$
RewriteRule ^plugins/feedback.php(.*)/?$ %1? [L,R=301]
</ifmodule>
 

Горе