Търся: Изработка на WP плъгин

Аз предлагам вместо да се карат, да обединят усилия и да си пуснат един сървис от скрапнатата информация. Малко по-позитивно трябва ситга с тоя хейт :) Има търсене, няма предлагане.
 
@hristonev чул си за xpath, но това нищо не значи. Щом е 5 реда - сядай си, слаб две!

@imagination то и такива услуги има, но ...
 
:oops: е тва е, нашари ми бележника. Верно не съм гуру скрапер ама принципа е ясен. Пипаш леко, да не те усетят. Крончето скрапи в различни часове, да не сверяват часовника на сървъра по твоята заявка :D. Заявката можеш да си пускаш и различни User-Agent. Останалото са свободни интерпретации по темата. Началото на ръководството "Как да скрапим по-добре" е дадено ;).
 
Като толкова искате да си ги мерите пратете ми кодовете си и ще ви кажа кой крив, кой прав.
Нищо че от сега е ясен отговора де :)
Давай го щом е ясен?
Инак е ясно, че няма 100% гаранция, но поне 90% лесно се постига. Изкуствен интелект едва ли ще се прави за един парсер ама виж поне една мозъчна гънка може. Това хващане само за един клас/ид е ясно, че при промяна нищо няма да работи, но винаги можеш да се хванеш за колко неща и да имаш по-голям шанс - тествано и работи.
 
Пипаш леко, да не те усетят. Крончето скрапи в различни часове, да не сверяват часовника на сървъра по твоята заявка :D.
Е за livescore feed му трябват данни максимум на 1 минута, даже и по-често...
 
Сега ми остана малко време да се поразгледам. Прегледах кода на LiveScore.com. Стрийма с информация е напълно достъпен за всеки:
http://www.livescore.com/~~/r/05/hpx/soccer/live/2/
Само че ползват криптиране на текста с JavaScript, ето този файл:
http://cdn1.livescore.com/web2/js/custom.min.3b3208bf.js
Като се прекара през javascript beautifier вече става за четене криптиращият алгоритъм.
От тук насетне, който е мераклия и се оправя с javascript, може да си декриптира стрийма. Декриптера лесно може да се пренапише на PHP. Но не съм сигурен, че не сменят периодично (примерно на всеки час) името на стрийма или нещо друго.
Подхода, който са избрали Лайвскоре е доста интересен. Публичен и достъпен за всеки, но все пак сравнително защитен и не може да се парсне с DOM-модела, освен ако не се ползва браузер-емулатор (което нe e проблем за хората с VPS - lynx например).
 
Последно редактирано:

Горе