Принципа, на работа на сайтове като pazaruvaj . com

uni-web

Well-Known Member
Здравейте,

Колеги тук си имаме един спор с колега, а именно как си събират инфото сайтовете за сравнение от типа на:

pazaruvaj . com, sravni . bg, shopmania . bg.

С бот, или ръчно се адва инфото според вас?
 
От: Принципа, на работа на сайтове като pazaruvaj . com

С XML файлове автоматично. Само слагаш един файл php в основната директория на сайта си.
 
От: Принципа, на работа на сайтове като pazaruvaj . com

XML, подготвен автоматично за сайта? Или бот който да си лази и да преиндексира, толкова умен, че да може да разбере на всеки един сайт кое какво е ?
С XML файлове автоматично. Само слагаш един файл php в основната директория на сайта си.
 
С отделен бот за всеки налазен сайт.
 
От: Принципа, на работа на сайтове като pazaruvaj . com

Знам само за Opencart как става. Иначе крумов е прав, всеки който се регистрира праща файл с който си пълнят категориите.
За Opencart се използва модула заGoogle Base
 
От: Re: Принципа, на работа на сайтове като pazaruvaj . com

Това луда работа бе човек, ако имаш 2000 сайта, за да има нагласиш всичко, и недайси боже да мръднат нещо.
С отделен бот за всеки налазен сайт.
 
От: Re: Принципа, на работа на сайтове като pazaruvaj . com

С отделен бот за всеки налазен сайт.
Т.е. те не е необходимо да знаят или да са съгласни! И пак може да стане? Друг е въпрос ако нещо се размрънкат, но не виждам смисъл, щом им пращаш нови пациенти!
 
От: Принципа, на работа на сайтове като pazaruvaj . com

Най-често се ползва нормален RSS фийд.
Не вярвам да има някой толкова луд, че да прасва толкова магазини като луд, като има по-лесен и нормален начин.
 
От: Принципа, на работа на сайтове като pazaruvaj . com

Въпроса е освен с подготвен файл от магазините, как може да става по друг начин, че да могат данните после да се категоризират и да се подреждат по различни признаци - да речем по цена!?
А иначе както един колега ми показа , как става при пазарувай http://www.pazaruvaj.com/admin/Login#feed-format
 
От: Принципа, на работа на сайтове като pazaruvaj . com

И, аз не вярвам някой да е толкова луд, че да го направи с бот лазещ по страниците да може да се сортират цени категории и простотии, освен, ако не са оказани в мета или някви тагове. Даже и гошко нямат такива истории за сега, а четенето на рсс или хмл не го смятам за бот.
Най-често се ползва нормален RSS фийд.
Не вярвам да има някой толкова луд, че да прасва толкова магазини като луд, като има по-лесен и нормален начин.
 
От: Принципа, на работа на сайтове като pazaruvaj . com

За Pazaruvaj знам, че става с подаване на xml файл с продуктите, който се подготвя от потребителя и се субмитва в сайта. Другите предполагам са на същият принцип.
 
От: Принципа, на работа на сайтове като pazaruvaj . com

Един RSS фийд е достатъчен, а мачването на продуктите в повечето пъти става от самосебе си... в други се изисква лека редакторска намеса.
Когато сайта стане достатъчно голям вече може да се изисква(поне това е моят опит) да се слага уникален нормер, който всеки продукт има така или иначе и еднакъв и при "пешо" и "гошо".
 
От: Принципа, на работа на сайтове като pazaruvaj . com

Дай, пример, като си толкова способен? И ми кажи, ако не е записано това в рсс, как ще го хванеш?
Един RSS фийд е достатъчен, а мачването на продуктите в повечето пъти става от самосебе си... в други се изисква лека редакторска намеса.
Когато сайта стане достатъчно голям вече може да се изисква(поне това е моят опит) да се слага уникален нормер, който всеки продукт има така или иначе и еднакъв и при "пешо" и "гошо".
 
От: Принципа, на работа на сайтове като pazaruvaj . com

@uni-web примерно книгите имат ISBN. При лаптопи/телефони/етц също има уникален номер за всеки продукт.
За дрехи и други подобни си нямам на идея как стоят нещата, но ако няма уникален номер се минава на план Б - сравняване на имената и човешка намеса.

Какво правех аз при сравнението:
Сравнявам наименованието
1. Ако имам пълно съвпадение - значи продуктите са еднакви.
2. Ако има частично съвпадение проверявам(пример: Acer Aspire E1-522) правя сравнение с някой друг параметър според продукта и източника на фийда(CPU/Video или брой страници) и се праща нотификейшън на хората, които модерират данните.
След като хората изберат точният продукт всичко става като случай 1. Обикновенно след една модераторкска намасе няма повече проблеми с този продукт от други магазини.

В последствие когато проекта с който имах взимане даване стана достатъчно голям се изисква от магазините, като им се обясни че това е за тяхно добро да добавят едно поле към RSS с уникалният номер на продукта. Така се процедиреша и със всички нови магазини, които искаха да се включат.
 
От: Принципа, на работа на сайтове като pazaruvaj . com

В Shopmania е със файл datafeed_shopmania_prestashop.php просто го ръгаш в хоста в глвната дир. на сайта и си тегли сам.
 
От: Принципа, на работа на сайтове като pazaruvaj . com

Писал, ли си бот до сега някога?
@uni-web примерно книгите имат ISBN. При лаптопи/телефони/етц също има уникален номер за всеки продукт.
За дрехи и други подобни си нямам на идея как стоят нещата, но ако няма уникален номер се минава на план Б - сравняване на имената и човешка намеса.

Какво правех аз при сравнението:
Сравнявам наименованието
1. Ако имам пълно съвпадение - значи продуктите са еднакви.
2. Ако има частично съвпадение проверявам(пример: Acer Aspire E1-522) правя сравнение с някой друг параметър според продукта и източника на фийда(CPU/Video или брой страници) и се праща нотификейшън на хората, които модерират данните.
След като хората изберат точният продукт всичко става като случай 1. Обикновенно след една модераторкска намасе няма повече проблеми с този продукт от други магазини.

В последствие когато проекта с който имах взимане даване стана достатъчно голям се изисква от магазините, като им се обясни че това е за тяхно добро да добавят едно поле към RSS с уникалният номер на продукта. Така се процедиреша и със всички нови магазини, които искаха да се включат.
 
От: Принципа, на работа на сайтове като pazaruvaj . com

Писал съм много ботове, защо?
 
От: Принципа, на работа на сайтове като pazaruvaj . com

Дай, ми цена тогава за автомат който само го нагласям през крона и да си шари по сайтовете и да ми вкарва по едно 200-300 страници в сайта.
Писал съм много ботове, защо?
 

Горе