Потребителите във Predpriemach.com - негативно и позитивно поведение

katsar0v

Active Member
@Blinky ако те интересува кратък анализ на това кой колко тъпизми е изписал с отношение (ratio) към това колко мнения е написал, мога да ти пратя няколко spreadsheet-а за този форум, не е точно за черен списък, но определено помага да се отсеят/филтрират някои отайки :)
 
Ако много искаш, и мислиш, че няма да обидиш някой, може да направиш една тема. Но пък защо не. Ще е забавно. За всички ли имаш или само на определени хора, които са ти се видели "потенциали"?

Имам информация за всички потребители :) Не знам дали ще обидя някого, със сигурност не целя това, началната идея беше да анализирам комюнитито тук и след това да предоставя информацията на собствениците ако е интересна и релевантна. Направил съм списък от думи и съм "скрейпнал" всяко едно мнение в този форум. Според автор се избират топ 3 "идиотизми" (отделни думи) по честота и след това се сравняват относително към броя мнения написал този автор във форума. Накрая се получава рейтинг кой автор колко простотии пише. Колкото по-ниско е числото, толкова по-добре, колкото е по-високо числото, толкова по-зле. Скала няма, предполагам е от 0 до 1, или 0% до 100%, според интерпретация.
 
Последно редактирано:
Имам информация за всички потребители :) Не знам дали ще обидя някого, със сигурност не целя това, началната идея беше да анализирам комюнитито тук и след това да предоставя информацията на собствениците ако е интересна и релевантна. Направил съм списък от думи и съм "скрейпнал" всяко едно мнение в този форум. Според автор се избират топ 3 "идиотизми" (отделни думи) по честота и след това се сравняват относително към броя мнения написал този автор във форума. Накрая се получава рейтинг кой автор колко простотии пише. Колкото по-ниско е числото, толкова по-добре, колкото е по-високо числото, толкова по-зле. Скала няма, предполагам е от 0 до 1, или 0% до 100%, според интерпретация.

link or didnt happen
 
Ми не, прост анализ на информация. Това тук не включва всички потребители, тъй като не всички са ги писали тези думи - https://drive.google.com/open?id=1OvSrD2cIB0CFtxmIC3e-a5UgjztbHvBW

Бтв имам и позитивен spreadsheet, но за него още няма отворена тема във форума :)

и думите които са в "лошия речник" са:
'идиот',
'еба',
'еби',
'педераст',
'педал',
'чекиджия',
'копеле',
'кур',
'тъп',
'путка',
'вагина',
'гей',
'гълтай',
'курва',
'курво',
'куро',
'мастия',
'олигорен',
'путколизец',
'хуя',
'гъз',
'шибаняк'

PS: явно не съм скрейпнал всички теми и съобщения, но голяма част от тях
 
Това прилича на подмолен подход да демонстрираш колко ти е богат речника на простотии. Не си обяснявам по друг начин тая наклонност да се занимаваш с подобни неща, и то в свободното си време.

Страничен ефект: заради горния пост сега би следвало да си в топа на класацията...
 
Това прилича на подмолен подход да демонстрираш колко ти е богат речника на простотии. Не си обяснявам по друг начин тая наклонност да се занимаваш с подобни неща, и то в свободното си време.

Страничен ефект: заради горния пост сега би следвало да си в топа на класацията...
Е чак да ми е богат речника едва ли, инспирирах се от http://www.youswear.com/index.asp?language=Bulgarian

Ще пусна и позитивния, като намеря и речник с позитивни думи. Сега видях в началната страница, че има 70 000 теми и 30к потребители. Скрейпнал съм само 33 000 теми, над 10 000 000 думи и близо 9к потребители.

@Noke от чист интерес реших да приложа някои стари и нови знания, а и обичам да пиша скрейпъри, нищо не съм искал да демонстрирам, седмици наред пазех информацията за себе си.

И колкото и странно да ви се струва, прочетох условията на сайта, където подобни действия не бяха забранени преди да започна :)
 
Ми не, прост анализ на информация. Това тук не включва всички потребители, тъй като не всички са ги писали тези думи - https://drive.google.com/open?id=1OvSrD2cIB0CFtxmIC3e-a5UgjztbHvBW

Бтв имам и позитивен spreadsheet, но за него още няма отворена тема във форума :)

и думите които са в "лошия речник" са:


PS: явно не съм скрейпнал всички теми и съобщения, но голяма част от тях

Евала за интересната информация :)
 
Ето и списъка с потребителите използващи най-често думите:


'благодаря',
'мерси',
'добър',
'извинявай',
'извинете'

с отношение към общия брой коментари: https://drive.google.com/open?id=1NzEShlL0ODkSu61lqAFeWfkdu41IN9IF

Респект към @Blinky и останалите в топа.

PS: Топа този път го направих по честота на използването на думите, като който иска може да избере и относителността за сортиране.
 
Как разбираме дали едно мнение е позитивно или не? Давам ти веднага пример - идва някой ИДИОТ, и пуска супер глупавият пост, respond-ваш и го наричаш идиот, и казваш защо - позитивно ли ти е мнението или не? И забравил си да exclude-неш quotes, което доста променя резултатите.
 
Как разбираме дали едно мнение е позитивно или не? Давам ти веднага пример - идва някой ИДИОТ, и пуска супер глупавият пост, respond-ваш и го наричаш идиот, и казваш защо - позитивно ли ти е мнението или не? И забравил си да exclude-неш quotes, което доста променя резултатите.

Премахнал съм цитати и линкове :)

Това е прост анализ, базов на 1во ниво, тъй като няма речници за семантични анализи на български е трудно, на английски става доста лесно. Използвам nltk, и там има даже и руски готов речник мисля, но за български няма.

Премахнал съм и пунктуация и подобни. А и съм скрейпнал сигурно само 1/3 от форума ако съдя по статистиките на началната страница. Може да се подходи и по различен начин и да се скрейпнат профилите, тъй като има някакъв рейтинг вече от самата система на форума.
 
Първо, обидена съм. Няма ме в списъка, а през годините тук имам няколко впечатляващи психотични епизода, по време на които все съм употребила някоя "грозна" думичка.

Второ, да дефинираш полезността (иначе не знам за чий... е тоя рейтинг) на потребителите на база брой използвани думи като "педераст" и "идиот", е меко казано идиотско. В списъка видях хора, които са фундаментът на форума. Едни от най-полезните и интересни персонажи.

Сори Кацаров, ама анализаторските ти напъни за момента изглеждат доста импотентни. Keep trying! ;)
 
Последно редактирано:
Първо, обидена съм. Няма ме в списъка, а през годините тук имам няколко впечатляващи психотични епизода, по време на които все съм употребила някоя "грозна" думичка.

Второ, да дефинираш полезността (иначе не знам за чий... е тоя рейтинг) полезността на потребителите на база брой използвани думи като "педераст" и "идиот", е меко казано идиотско. В списъка видях хора, които са фундаментът на форума. Едни от най-полезните и интересни персонажи.

Сори Кацаров, ама анализаторските ти напъни за момента изглеждат доста импотентни. Keep trying! ;)

Всеки може да си вади изводите за себе си както желае, а щом скрейпъра не те е достигнал, не си изпъкнала достатъчно, даже и аз съм във втория списък с минимален процент, а съм тук от седмици ;) а относно първия - псувай повече, говори глупости и прочие и ще излезеш в топа на следващия анализ.

Права си, напъни са, но са над 10 000 000 думи, от почти 9 000 потребители, топ 15 не мисля, че драстично ще се промени ако се скрейпнат 30 000 потребители и 100 000 000 думи. Блинки си има готовата база данни и може да пусне един nltk върху нея, не е сложно.

PS: Ще се радвам на допълнителна градивна "не-идиотска" критика, макар, че ми е ясно, че този анализ е доста доста базов и двата речника са ми сравнително бедни :)
 
Последно редактирано:
А защо всичко това се развива в тази тема? Сега кой ще прочете за онзи измамник с ваучерите?!?!?!

Честа практика в този форум е да се пише извън темата. Наклони темата към твоята посока с няколко смислени въпроса и коментара :) Сори за оф-топика с моя анализ...
 
Всеки може да си вади изводите за себе си както желае, а щом скрейпъра не те е достигнал, не си изпъкнала достатъчно, даже и аз съм във втория списък с минимален процент, а съм тук от седмици ;) а относно първия - псувай повече, говори глупости и прочие и ще излезеш в топа на следващия анализ.

Права си, напъни са, но са над 10 000 000 думи, от почти 9 000 потребители, топ 15 не мисля, че драстично ще се промени ако се скрейпнат 30 000 потребители и 100 000 000 думи. Блинки си има готовата база данни и може да пусне един nltk върху нея, не е сложно.

PS: Ще се радвам на допълнителна градивна "не-идиотска" критика, макар, че ми е ясно, че този анализ е доста доста базов и двата речника са ми сравнително бедни :)
Най-нормалното нещо на света е, като влезеш в дадено комюнити, да се опиташ да "разчетеш" образите в него. Да го правиш машинно обаче, и то на база идиотски зададени параметри, е неефективно. Машината не може да измести напълно човека. Напъваш мозъка си погрешно. Вместо да създаваш алгоритми, използвай умствения си капацитет, за да анализираш сам кой има тежест във форума, кой е полезен, и кой не. Хората, използвали някакви квалификации като "идиот", "тъпанар" и "да еба" в голямата си част са едни от най-успешните онлайн предприемачи и едни от най-полезните за форума.

Чети темите и анализирай! Докато оставяш преценката на машина, ще получаваш и машинни резултати, тоест недоклатени такива. Не изключвай човешкия фактор, когато се касае за човеци. :)
 

Горе