Condividi:        

?Funzionamento/Progettazione di un motore di ricerca

Discussioni e opinioni costruttive sul mondo dell'informatica.
Per la soluzione di problemi specifici fare riferimento alle sezioni di assistenza!

Moderatori: aurelio37, Anthony47, axelrox

?Funzionamento/Progettazione di un motore di ricerca

Postdi piercing » 24/09/02 14:09

Poniamo che io voglia creare un motore di ricerca. Non tanto un discorso internet... fatto di spider, URL e indicizzazioni,

ma di una ricerca di testo per esempio... ho una pubblicazione piccola... diciamo tre pagine per esempio...

ho un campo di testo in cui inserisco la chiave di ricerca...

i risultati devono uscire in un ordine di importanza... quindi prima risposte fedeli, e poi risposte sempre più prossime...

ovviamente non sarà solo una SELECT o comunque una LIKE, ma un discorso diciamo "intelligente" che possa capire che ho inserito una chiave di ricerca vaga... o meno vaga.... e quindi trarre le sue conclusioni...

Come si struttura una problematica del genere?

Accetto bibliografie, URL, consigli, progetti, incoraggiamenti e insulti...

Grazie! :P
Avatar utente
piercing
Moderatore
 
Post: 7569
Iscritto il: 10/04/02 10:34
Località: Roma

Sponsor
 

Postdi Nicola » 24/09/02 14:14

[critica]
e poi ti lamenti delle robe strane di BC :D
[/critica]
credono che abbiano un dB no ?
credo che se i risultano siano inferiori di tot robe te lo dice o qualcosa del genere...
Nicola
Nicola
Utente Senior
 
Post: 7381
Iscritto il: 08/02/02 01:00

Postdi Nemok » 24/09/02 14:26

Beh credo che posta così la questione sia un po' vaga.....intanto qual'è l'obiettivo reale?Cercare parole in un testo o cercare pagine in un database?E poi:linguaggio di programmazione?Se si tratta solo di attingere a database basta SQL,opportunamente impostate le query non dovrebbero esserci problemi.Se stiamo parlando di ricerca in un testo (o in genere in un file) invece sarebbe meglio qualcosa di piu potente,C/C++.

Oppure più semplicemente se hai un database "statico" potresti usare dei marcatori inseriti da te.Ad esempio ad una pagina in cui l'argomento è "programmazione e reti" potresti attribuire i marcatori "programmazione" e "reti",in modo da creare un legame biunivoco tra i termini e le pagine.

Incoraggiamenti:daje piercing!!
Insulti:°*ç%&!
Nel 1968 la potenza operativa di 2 C-64 hanno portato un razzo sulla luna. Oggi la potenza operativa di un Athlon 4000+ viene usata per far girare Windows XP....Qualcosa deve essere andato storto....
--Powered by Debian Sid/unstable on 2.6.10--
Nemok
Utente Senior
 
Post: 1420
Iscritto il: 04/09/01 01:00
Località: Roma

Postdi piercing » 24/09/02 14:28

Robe strane?? naaa.... :lol: è solo una bella ideuzza che m'è venuta stanotte...

Niko.... siamo un pò oltre al concetto del DB... sicuramente un DB va bene per lo "stoccaggio" dei dati...

il problema è l'algoritmo della ricerca... non basta una select su un campo di testo... è troppo stupida e meccanica...

pensa un attimo... quando metti un chiave di ricerca su un sito... quello che succede... i siti escono ordinati... e casualmente quello che cerchi è sempre o quasi sulla prima pagina... come fà?
ci sono delle tecniche di raffinamento delle ricerche... di ordinamento, di indicizzazioni... ma sinceramente non so che pesci prendere...

mi ricordo solo qualcosa riguardo a un piccione... da cui google aveva tratto spunto per fare il suo motore di ricerca... (mi pare proprio se ne parlò quassù)
Avatar utente
piercing
Moderatore
 
Post: 7569
Iscritto il: 10/04/02 10:34
Località: Roma

Postdi kadosh » 24/09/02 14:57

Sicuramente un Motore di Ricerca che si rispetti avrà vari DB divisi secondo un loro criterio e contenenti tutto il materiale che serve, continuamente aggiornato. Di lì partiranno una serie di Query innestate atte a discernere l'importanza del risultato trovato.
Forse useranno un range di parole fisse e combinate, e a seconda del numero di queste parole trovate caricheranno una percentuale di riferimento rispetto alla tua ricerca.
Cmq il discorso è davvero molto vasto, vedo se trovo cose interessanti sulla rete e te le posto......assieme agli insulti :D :D :D
Ch®is ˜˜ www.glgroup.it˜˜ {~Up You® Life~}™ Semper Fidelis
Avatar utente
kadosh
Moderatore
 
Post: 3791
Iscritto il: 24/09/01 01:00
Località: Roma

Postdi piercing » 24/09/02 16:02

allora vediamo un pò di chiarire...

con un esempio...

poniamo che io faccia un sito di autori emergenti che mi mandano dei testi dei loro manoscritti. Come detto roba di poche pagine. Diciamo di tre.

Bene... a questo punto voglio cercare tutte i racconti che ad esempio parlino di "cane", trovando però anche quelli che parlano di cani. Trovando anche un elenco di termini simili... (che ne sò.... magari pescecane).

Ovviamento mi escono mille racconti e allora scrivero "cane pechinese", e allora mi usciranno 10 racconti...

ma se fossero scritti sul racconto come "cani pechinesi"?

E fare una select like su diecimila racconti di tre pagine quanto ci metterei? forse tre mesi...

ed è per questo che i motori di ricerca non funzionano così, ma creano una sorta di indicizzazione di ogni racconto con le parole chiave, e solo quelle vengono inserite nel database, una volta "testata" la corrispondenza su una sorta di tabella dizionario che poi diventa effettivamente l'unica tabella del DB da gestire.

Io penso proprio che funzionino così, mi pare l'unica maniera possibile, ma mi chiedevo quale poteva essere un buon metodo di indicizzazione, una volta che conosco bene il dizionario (che non necessariamente a questo punto deve essere il dizionario della lingua italiana, ma anche uno custom costruito ad hoc per l'ambito del motore di ricerca).

Meglio che dormo di notte eh? 8)
Avatar utente
piercing
Moderatore
 
Post: 7569
Iscritto il: 10/04/02 10:34
Località: Roma

Postdi Frengo78 » 24/09/02 16:07

Vengo io a cantarti la ninna nanna se necessario. Oppure ti faccio sniffare un po' di gas dal fornello della cucina

Sinceramente non ho idea di quale funzionamento abbia. Chiedetelo a google
Knowledge is a weapon
Frengo78
Utente Senior
 
Post: 8985
Iscritto il: 16/07/02 08:41
Località: Torino

Postdi Mikizo » 24/09/02 16:17

Ricordo benissimo di aver letto la cosa dei piccioni di Google... ricordo pure il disegno del piccione!
Ma non è che sarà in una vecchia newsletter?
---------
Mi rispondo: si, è in una news di pc-facile!
http://www.google.com/technology/pigeonrank.html
Avatar utente
Mikizo
Download Admin
 
Post: 8517
Iscritto il: 05/01/02 01:00
Località: Outside

Postdi piercing » 24/09/02 16:26

azz... siamo nelle mani di un piccione...

uhmmm come info è un pò pochino...

se non mi ricordo se ne parlo anche un annetto fa forse su PC-Professionale... stanotte mi sfondo la libreria...

Esiste tutta una teoria sui motori di ricerca... basterebbe trovare dove...

Studentiiiiii.... sulle tesi delle vostre università d'informatica?

Uhmmmmm...... eppure ci deve essere una soluzione... :idea:

(Me lo diceva la mamma.... ti fai troppe piiiiiiiiiiiiiiiiiiiiiiip mentali...)
Ultima modifica di piercing su 24/09/02 16:28, modificato 1 volte in totale.
Avatar utente
piercing
Moderatore
 
Post: 7569
Iscritto il: 10/04/02 10:34
Località: Roma

Postdi Frengo78 » 24/09/02 16:27

Si si lo so che l'inglese lo dovrei capire alla perfezione. Ma alle 17:30 non si puo avere un riassunto della traduzione da te piercing? Per i non capenti..
Knowledge is a weapon
Frengo78
Utente Senior
 
Post: 8985
Iscritto il: 16/07/02 08:41
Località: Torino

Postdi Frengo78 » 24/09/02 16:28

Ma da quando ho la dicitura off topic sopra il nick???? chi è stato???? :eeh: :eeh: :eeh: :eeh:
Knowledge is a weapon
Frengo78
Utente Senior
 
Post: 8985
Iscritto il: 16/07/02 08:41
Località: Torino

Postdi piercing » 24/09/02 16:36

oltre al fatto che apprezzo l'ultima operazione di wm (anche io me ne sono appena accorto frengOT)...

raga... sto traducendo e sono allibito... i piccioni sono veri!!! possibile???? :eeh: :eeh: :!:
Avatar utente
piercing
Moderatore
 
Post: 7569
Iscritto il: 10/04/02 10:34
Località: Roma

Postdi Nemok » 24/09/02 17:13

frengo78 ha scritto:Ma da quando ho la dicitura off topic sopra il nick???? chi è stato???? :eeh: :eeh: :eeh: :eeh:



Stramitico frengo!!!!Sei il primo utente ad avere una dicitura personalizzata!!!farai invidia a tutti!
:D ;)
Nel 1968 la potenza operativa di 2 C-64 hanno portato un razzo sulla luna. Oggi la potenza operativa di un Athlon 4000+ viene usata per far girare Windows XP....Qualcosa deve essere andato storto....
--Powered by Debian Sid/unstable on 2.6.10--
Nemok
Utente Senior
 
Post: 1420
Iscritto il: 04/09/01 01:00
Località: Roma

Postdi kadosh » 24/09/02 17:29

Frengo...AHAHAHAHAHAHAHAHAHAHAH...ops...pardon :D :D 8)
Ch®is ˜˜ www.glgroup.it˜˜ {~Up You® Life~}™ Semper Fidelis
Avatar utente
kadosh
Moderatore
 
Post: 3791
Iscritto il: 24/09/01 01:00
Località: Roma

Postdi Nicola » 24/09/02 17:42

frengo78 ha scritto:Ma da quando ho la dicitura off topic sopra il nick???? chi è stato???? :eeh: :eeh: :eeh: :eeh:

io voglio la mia scritta : Moderatore Intelligente :D
WM dai ... falla ... x favore... :oops:
Ciao
Nicola
Nicola
Utente Senior
 
Post: 7381
Iscritto il: 08/02/02 01:00

Postdi Triumph Of Steel » 24/09/02 18:09

cos'è la storia dei Piccioni??
Avatar utente
Triumph Of Steel
Moderatore
 
Post: 7852
Iscritto il: 22/08/01 01:00

Postdi dado » 24/09/02 19:03

UHUHUHUHUHUH... ehm :oops:
Torno serio, ora, raga... ! 8)
Ma una risatina ci scappa... :D

House: "Vede, tutti pensano che sia un paziente a causa del bastone"
Wilson: "Allora perchè non indossa un camice bianco come tutti noi?"
House: "Perchè altrimenti pensano che sia un medico".
Avatar utente
dado
Utente Senior
 
Post: 16208
Iscritto il: 21/08/01 01:00
Località: La Città dei Sette Assedi

Postdi BrSys » 24/09/02 21:26

Ragazzi!!!
Mi meraviglio di voi!! :eeh: :eeh: :eeh:

Andate all'indirizzo dei piccioni.
http://www.google.com/technology/pigeonrank.html

Nella barra degli indirizzi digitate il seguente codice javascript:

javascript:alert(window.document.lastModified)

Uscirà la data di ultima modifica del documento... indovinate un po'?

Se non siete ancora convinti...
http://www.google.it/search?q=google+pi ... &hl=it&lr=

Siete perdonati perchè a quanto pare ai tempi ci è cascata pure ADN Kronos. :D

Bye, Gabriele
Immagine
BrSys
Utente Senior
 
Post: 212
Iscritto il: 16/07/02 11:51

Postdi piercing » 24/09/02 21:52

infatti br.... all'inizio mi pareva plausibile... poi quando ho capito bene il concetto mi è sembrata una gran ca22ata... e l'hai dimostrato BR...

nel frattempo mi ero documentato altrove su google, più che altro per capire il discorso dell'indicizzazione e della rilevanza.

Beh... ho tirato fuori un bel pò di numeri, ma purtroppo tutti molto orientati al discorso web (che a me interessa poco o nulla).

Il vero cavallo di battaglia di Google è il PageRank, che in pratica conta quante pagine web linkano a quella pagina specifica e più pagine ci linkano più vuol dire che il sito è rilevante, e viene messo per primo nell'ordine di importanza... questo metodo, utilizzato su grandi numeri, e quindi su leggi statistiche porta alla grande affidabilità di google.

Se volete vi do un pò di numeri, anche se sono di un annetto fà...

Il mio problema però rimane :cry: , passerò un'altra notte insonne!! e voi XXXtardi non mi aiutate!!! ;)
Avatar utente
piercing
Moderatore
 
Post: 7569
Iscritto il: 10/04/02 10:34
Località: Roma

Postdi Mikizo » 24/09/02 22:13

Beh, per lo meno ci siamo cascati in tanti...
Poi non è che ci avessi capito qualcosa, comunque.
Pierce, ma vuoi rifare Google in locale? Credo che, come dici tu stesso nel tuo post, il sistema di Google dipenda strettamente dal fatto che le pagine in questione sono in rete, quindi linkate e cliccate...
Avatar utente
Mikizo
Download Admin
 
Post: 8517
Iscritto il: 05/01/02 01:00
Località: Outside

Prossimo

Torna a Discussioni


Topic correlati a "?Funzionamento/Progettazione di un motore di ricerca":


Chi c’è in linea

Visitano il forum: Nessuno e 44 ospiti