allora vediamo un pò di chiarire...
con un esempio...
poniamo che io faccia un sito di autori emergenti che mi mandano dei testi dei loro manoscritti. Come detto roba di poche pagine. Diciamo di tre.
Bene... a questo punto voglio cercare tutte i racconti che ad esempio parlino di "cane", trovando però anche quelli che parlano di cani. Trovando anche un elenco di termini simili... (che ne sò.... magari pescecane).
Ovviamento mi escono mille racconti e allora scrivero "cane pechinese", e allora mi usciranno 10 racconti...
ma se fossero scritti sul racconto come "cani pechinesi"?
E fare una select like su diecimila racconti di tre pagine quanto ci metterei? forse tre mesi...
ed è per questo che i motori di ricerca non funzionano così, ma creano una sorta di indicizzazione di ogni racconto con le parole chiave, e solo quelle vengono inserite nel database, una volta "testata" la corrispondenza su una sorta di tabella dizionario che poi diventa effettivamente l'unica tabella del DB da gestire.
Io penso proprio che funzionino così, mi pare l'unica maniera possibile, ma mi chiedevo quale poteva essere un buon metodo di indicizzazione, una volta che conosco bene il dizionario (che non necessariamente a questo punto deve essere il dizionario della lingua italiana, ma anche uno custom costruito ad hoc per l'ambito del motore di ricerca).
Meglio che dormo di notte eh?
