Neprecizni rezultati pretrage

Bug #637927 reported by chaghaboo
16
This bug affects 3 people
Affects Status Importance Assigned to Milestone
Ubuntu-rs Forum
Won't Fix
High
Slobodan Terzić

Bug Description

Imam problem sa pretraživanjem foruma, rekao bih da pretraživanje na ovom forumu dosta loše radi svoj posao. U svakom slučaju da vam iznesem svoje utiske pa da vidimo da li sam to samo ja u pitanju ili veštačka inteligencija iza pretraživača.

1. Rezultati koje dobijam pretragom su neprecizni i uopšte nisu poređani po relevantnosti, sem toga kao rezultat dobijam brdo stranica, pa ispada da mi je lakše da ručno prelistam neku podsekciju foruma nego da koristim pretragu. Mislim da nisam toliki duduk da ne umem da uradim pretragu, a i čini mi se da je pretraga na starom forumu radila mnogo bolje. Da nije mašina za pretraživanje u pozadini ovog foruma "manje pametna"?
Konkretno sam probao da pogledam sve teme u čijim naslovima se nalazi "ubuntu one", pokušajte da vidite kakvi se rezultati dobijaju. I to je samo poslednji slučaj, ranije sam čak odustajao jer rezultati pretrage nisu imali nikakvog smisla.

2. Ukoliko mi rezultati pretrage nisu dovoljno precizni i odmah probam da ponovim pretragu dobijem sledeću poruku: "Sorry, but you can only perform one search every 30 seconds. Please wait another 4 seconds before attempting to search again.", što je pomalo iritantno jer trebam da "zviždućem" 20tak sekundi pre nego ponovim pretragu i tako svaki put.

3. Pretraga nije dozvoljena za reč sa manje od 4 slova. Pa tako ne bih li dobio preciznije rezultate za gore pomenutu temu otkucao sam u polju pretraga "one" i obeležio da želim sve teme koje u naslovu sadrže one ali je pretraga odbila da se izvrši zbog toga što reč ima manje od ta definisana 4 slova. U ovom konkretnom primeru se vidi da pretraga od 3 slova i te kako može da ima smisla.

Changed in ubuntu-rs-forum:
status: New → Opinion
importance: Undecided → Medium
assignee: nobody → Slobodan Terzić (githzerai)
Revision history for this message
Slobodan Terzić (githzerai) wrote :

Ovako: forumska pretraga jeste neprecizna, što je u neku ruku očekivano.
Ono što je neočekivano je da je ovo tek prva pritužba na to, a očekivao sam više (kako bi se dobili relevantni podaci o kvalitetu pterage).

Za pretragu su bitna tri faktora: to što na forumu imamo praktično tri pisma i dva jezika, zatim čijenica da se za bazu koristi utf8 kodiranje, ali je isto tako i bitno na koji način korisnici pretražuju.

Na forumu se piše ćelavom latinicom i srpskom latinicom i ćirilicom, i upravo je to redosled kojim pretrage daju prednost. O izjednačavanju istih reči u oba pisma da ne govorim (Ubuntu nije isto što i Убунту).

Jedan vrlo efikasan primer za ovo je kada se na sistemu koji koristi srpsku lokalizaciju ćirilicom otvori dijalog „Otvori pomoću“, a programi složeni tako su da oni koji su neprevedeni na vrhu (jer su izvorna imena latinična), a prevedeni idu na dno.

Zatim, utf8 kodiranje se u normalnim okolnostima koristi samo kao rezervno rešenje za baze podataka, dok mi zbog ćirilice i latinice moramo da ga koristimo kao primarno. Pojašnjenje: to što utf8 može da prikazuje sve (ili skoro sve) znakove, ne znači da će se oni pravilno slagati u bazi. A MySQL kolaciju po pravilima srpske ćirilice i latinice čekamo ko Godoa.

Kvalitet zadatih parametara takođe igra veliki uticaj u pretrazi, recimo dve ili više ključnih reči uvek daju mnogo bolje rezultate, a ograničavanje pretrage na samo određeni podforum daje još i bolje (zato i jeste toliko bitno da se teme postavljaju u pravim podforumima i da imaju odgovarajući smislen naziv).

E, a sa drugre strane imamo Google, čiju smo prilagođenu pretragu koristili i na prethodnom forumu.
Problem sa njom je što još uvek ima mnogo keširanih veza po nomenklaturi starog foruma, što automatski vodi na 404 stranicu.
Napravi sam novi prilagođeni pretraživač, poslao sam sitemap foruma Guglu, i nadam se da će se situacija sa starim keširanim stranicama uskoro popraviti.

Prilagođeni pretraživač možeš probati ovde: http://tinyurl.com/2gxhlrr
Zanima me koliko su rezultati bolji/lošiji?

Trenutno radim na nadogradnji foruma (u međuvremenu je izašla nova veća verzija koja zahteva prilagođavanje naših već prilagođenih šablona, što donekle stvara probleme), pa ću se nakon toga potruditi da nekako ubacim i ovu prilagođenu pretragu na neko vidno mesto.

Dotle su svi predlozi dobrodošli. :)

Revision history for this message
chaghaboo (marko.niketic) wrote :

Zdravo gitzherai,

pravo da ti kažem nepreciznost pretrage mi je zapala za oko ubrzo nakon što je oživeo novi forum jer i ranije sam obilno koristio pretragu, ali mislio sam da će se stvari vremenom srediti pa reko da ne budem negativac tek što je postavljen novi forum s obzirom na odličan posao koji ste obavili i obim celog zahvata.

Objašnjenje stoji, ali bez obzira na kompleksnost problema ukoliko se ne bude rešio pretraga neće imati puno smisla. Po meni je tu najveći problem to što se dupliranje tema na forum izbegava upravo tako što se članovi upućuju na pretragu, pa ukoliko ne bude davala precizne rezultate imaćemo spagetti incident.

Rezultati koje je davala pretraga na starom i novom forumu se iz mog iskustva drastično razlikuju, čak i uz moj maksimalni trud zadavanja što preciznijih parametara (svih koje si pomenuo) rezultati su bili takvi da sam odustao i ručno tražio.

Na žalost ne mogu da pomognem sa tehničke strane niti davanjem drugih rešenja i predloga, ne razumem se. Ali sa druge strane barem mogu da upoređujem rezultate pretraživanja i da ti šaljem šta sam dobio i na taj način ti pomognem. Ali sam večeras i sutra prilično zauzet, pa da onda u četvrtak malo uporedim ova dva pretraživača i da ti sumiram rezultat. Da ti ne bih slao nešto neupotrebljivo već da to ipak bude dovoljno da se može izvući neki zaključak. Ako mogu još nekako da pomognem samo javni.

Pozdrav

Revision history for this message
Petar Vasić (p-vasic) wrote : Re: [Bug 637927] Re: Neprecizni rezultati pretrage

> E, a sa drugre strane imamo Google, čiju smo prilagođenu pretragu koristili i na prethodnom forumu.
> Problem sa njom je što još uvek ima mnogo keširanih veza po nomenklaturi starog foruma, što automatski vodi na 404 stranicu.
> Napravi sam novi prilagođeni pretraživač, poslao sam sitemap foruma Guglu, i nadam se da će se situacija sa starim keširanim stranicama uskoro popraviti.
>
> Prilagođeni pretraživač možeš probati ovde: http://tinyurl.com/2gxhlrr
> Zanima me koliko su rezultati bolji/lošiji?

gitz,

Izbaci iz CSE-a sve strane koje sadrže viewthread.php i slične stare
nomenklature, tako ćeš barem malo ubrzati izbacivanje stvari iz
google-a.

Nažalost, to će samo delimično rešiti problem. Google rankira strane
(između ostalog) po broju linkova koji na nju pokazuju. Kad neko
otvori novu temu i postavi 100 puta postavljeno pitanje, stavi se link
ka staroj temi, a nova se zatvori. Tako prava stranica dobija malo
veći rank. Međutim, pošto svi stari linkovi više ne rade, sve stranice
će imati isti rank, pa će morati sve nanovo... ali barem će
ćirilica/latinica raditi malo bolje.

PS
Sada na tebi ostaje da učiš nove generacije da ove greške ne ponove
kada nekome ponovo padne na pamet da menja forumski softver ;)

Revision history for this message
chaghaboo (marko.niketic) wrote :

Gitzherai,

upravo sam pretraživao sve i svašta i rezultati koje sam dobijao sada i oni na koje sam se žalio ne mogu da se porede! Ne mogu da kažem da li je pretraga bolja ili lošija nego na prethodnom forumu, znam samo da sam bez problema vrlo brzo nalazio ono što sam tražio. U svakom slučaju rekao bih da više ne može da se kaže da pretraga nije precizna. Čak mi se čini da je izuzetno dobra.

Ovom prilikom nisam dobijao brdo rezultata koji nemaju veze sa traženim pojmom već su rezultati i te kako imali smisla i čak su, čini mi se, dosta dobro rangirani po relevantnosti. Nema više poruke da moram da sačekam 30 sekundi za novu pretragu, i mogao sam da pretražujem i pojmove sa manje od 4 slova. Rezultati dobijeni za isti traženi pojam na forumskom i pretraživaču za koji si ostavio link nisu identični ali daju jako slične rezultate. Koliko sam video ovaj za koji si dao link pretražuje i sajt i planetu pa je i logično da neće dati identične rezultate.

Rekao bih da je stvar rešena, ali hajde da vidimo još u nekom narednom periodu kako će stvari da izgledaju.

Hvala!

description: updated
Revision history for this message
chaghaboo (marko.niketic) wrote :

Danas sam nastavio sa isprobavanjem pretrage i naišao sam na još jednu zanimljivu stvar. Pri pretraživanju naslova tema ukoliko se traženi pojam apsolutno ne poklapa sa nekim od naslova neću dobiti niti jedan rezultat pretrage.

Npr. pogledajte šta dobijate ako tražite pojam "huawei", šta dobijate za "huawei 1501", a šta za "huawei 1505".

Za prvi pojam dobijam sve teme čiji naslovi sadrže zadati pojam.
Za drugi pojam dobijam isključivo naslove koji sadrže obe reči: i "huawei" i "1501". Logično bi bilo da dobijem teme koje sadrže oba pojma izlistane prve, ali da ih ipak slede teme koje u naslovu sadrže jedan ili drugi traženi pojam - samo huawei ili samo 1501.
Za treći pojam ne dobijam ni jedan rezultat jer modem huawei sa oznakom 1505 ne postoji u stvarnosti, postoji 1550. Ali opet, logično bi bilo da dobijem rezultate koji sadrže pojam koji postoji, a to je huawei.

Revision history for this message
Slobodan Terzić (githzerai) wrote :

Nešto sam malo čeprkao po pretrazi, na osnovu iskustava drugih korisnika MyBBa, i mislim da je pretraga sada dosta bolje (kao što i sam kažeš).

Što se tiče definitvnog rešenja ovog problema, moraće malo da sačeka jer imam privatnih obaveza koje me sprečavaju da budem aktivan na forumu narednih 15ak dana, naravno, osim ako neko drugi ne nađe rešenje i preuzme stvar u svoje ruke. ;)

@v0xel
Nisam siguran da bi i buduće generacije postupile bolje postupile nego što smo mi. XMB je forumska platforma koja je već dugo na zalasku, sa ograničenim brojem programera i sumnjivom budućnošću. MyBB je upravo suprotno od toga, veoma razrađen softver sa ogormnom brojem korisnika i stabilnim planom za budućnost.
Pride je ima i jedini konverter iz XMBa koji radi. Konverter nije savršen, stvori je neke probleme, ali je prelazak i rešio mnoga druga pitanja.
Mislim, poznaješ situaciju sa starim forumom, ne moram da ti je prepričavam, i moraš priznati da je sama činjenica da smo uopšte uspeli da spasimo 98% važnih podataka veliki uspeh. ;)

Changed in ubuntu-rs-forum:
status: Opinion → In Progress
importance: Medium → High
Revision history for this message
chaghaboo (marko.niketic) wrote :

Čini mi se da bi još rešavanje ovog poslednjeg problema koji sam naveo dovelo stvari u potpuni red. Ne znam jedino da nema još nečega čime vi iza foruma niste zadovoljni, ali meni se relevantnost pretraživanja, sa izuzetkom poslednjeg problema, čini sasvim na adekvatnom nivou.

I da ne ispadnem kao gonič robova, meni se apsolutno nigde ne žuri, a evo za kratko vreme si potpuno beskorisnu pretragu učinio potpuno korisnom i upotrebljivom, samo što joj je izgleda još uvek malo mutno na jedno oko. Ali to bez žurbe, već sada je to sasvim druga priča.

Hvala još jedanput tu sam ako ikako mogu da pomognem.

Pozdrav

Revision history for this message
Slobodan Terzić (githzerai) wrote :

Standardna forumska pretraga je zamenjena Googleovom, oto toga bolje ne može...

Changed in ubuntu-rs-forum:
status: In Progress → Won't Fix
To post a comment you must log in.
This report contains Public information  
Everyone can see this information.

Other bug subscribers

Remote bug watches

Bug watches keep track of this bug in other bug trackers.