Questo sito utilizza cookie per raccogliere informazioni sull'utilizzo. Cliccando su questo banner o navigando il sito, acconsenti all'uso dei cookie. Leggi la nostra cookie policy.OK

WebFountain un nuovo modo di cercare nel web

pittogramma Zerouno

WebFountain un nuovo modo di cercare nel web

02 Feb 2005

di Carlo Cremona

Dai laboratori di Almaden di Ibm arriva un approccio innovativo alla ricerca di informazioni sul web: non solo trovare, ma capire quello che si è trovato e trattarlo di conseguenza

Che i motori di ricerca siano il ‘sale’ della Rete lo ha ancora una volta ricordato a tutti la valutazione attribuita dai mercati finanziari a Google quando lo scorso 19 agosto ha debuttato al Nasdaq. Ma l’efficacia dei diversi motori di ricerca esistenti, Google compreso, è in realtà ancora molto lontana da quella che sarebbe desiderabile. Essi sono infatti capaci di estrarre dal Web solo dati e informazioni isolate riguardanti singoli argomenti, ma non sono assolutamente in grado di fornirne, allo stato attuale del loro sviluppo, una comprensione più profonda dei suoi contenuti.

Per raggiungere questo risultato, si sta in effetti lavorando su più fronti. Ad esempio Tim Berners-Lee, il padre riconosciuto del Web, da alcuni anni sta studiando il problema del come ‘iniettare’ nel Web una maggiore capacità di comprensione dei significati nascosti nell’enorme groviglio di documenti in esso presenti. L’idea di fondo è quella di realizzare un ‘Web Semantico’: un ambiente i cui ‘oggetti’ siano presenti oltre che con i loro contenuti, anche con gli elementi capaci di descriverli e con le regole che consentano di elaborarli in termini concettuali. Un progetto interessante, che potrebbe sicuramente migliorare in termini generali l’efficacia dei motori di ricerca, ma che appare viziato da una contraddizione implicita. Per avere la massima diffusione, infatti, i criteri da utilizzare per descrivere le pagine Web dovrebbero essere semplici e alla portata di tutti. Ma più i criteri impiegati sono elementari, più incompleta e inefficace risulterà la ricerca, per il motivo che catalogare in modo intelligente le risorse presenti nella Rete non è affatto semplice.

Così poco semplice da convincere alcuni ricercatori del laboratorio Ibm di Almaden, in California, a cambiare completamente approccio, e a utilizzare la stessa ‘forza bruta’ che solo qualche anno prima aveva consentito a un potentissimo computer di battere il campione mondiale di scacchi. Solo che la forza bruta necessaria doveva essere ancora maggiore. WebFountain, il primo motore di ricerca ‘intelligente’ messo a punto da Ibm – e i cui servizi sono già disponibili – è il risultato di un progetto in cui sono già stati investiti 100 milioni di dollari. Gira su un supercomputer costituito da un migliaio di processori Linux il quale, con tutti i suoi componenti ausiliari (router e unità di memoria) occupa una superficie pari alla metà di un campo di calcio.  Nei suoi dischi sono attualmente indicizzate oltre 5 miliardi di pagine Web (più di quelle di Google, quindi), mentre 9000 programmi che girano contemporaneamente possono trattarne ogni giorno 50 milioni di nuove.

L’indicizzazione effettuata da WebFountain è tuttavia completamente diversa da quella impiegata dai normali motori di ricerca. La tecnologia messa a punto dall’Ibm è in grado infatti non solo di leggere, ma anche di ‘capire’ il contenuto dei vari tipi di dati, semistrutturati e non- strutturati presenti nel Web (compresi i blog, le newsletter, le e-mail, le chat-room, ecc.) dopo averli convertiti in formati trattabili da parte dei più avanzati strumenti di analisi testuale. Il che permette, e questo è il risultato più importante, di correlarli tra loro e di individuare gli schemi, le relazioni e i trend in essi contenuti.

La vera innovazione introdotta da WebFountain è infatti quella di avere superato la staticità degli attuali motori di ricerca introducendo una nuova prospettiva, quella temporale, e aprendo così possibilità di utilizzo del tutto nuove della Rete stessa.

WebFountain consente infatti alle aziende di avere informazioni tempestive, personalizzate e approfondite di un genere non facilmente disponibile oggi, come quelle ottenibili rispondendo a domande del tipo: “qual è la percezione che il mercato ha di noi?”, “in che modo questa percezione sta evolvendo nel tempo?”, “come si stanno muovendo i nostri concorrenti?” e molto altro ancora. In realtà WebFountain, che concettualmente è qualcosa di molto diverso da un motore di ricerca tradizionale, non è nemmeno destinato, come quelli, al grande pubblico. Le risposte che può elaborare data la loro natura e anche lo stato attuale della tecnologia, non possono essere fulminee come quelle alle quali ci hanno abituato Google e i suoi simili.Di fatto WebFountain si presenta, per il momento, come una tecnologia in grado di fornire servizi avanzati di business intelligence, che si integra in quella visione dell’informatica futura che va sotto il nome di on-demand computing. Una visione e al tempo stesso una scommessa, poiché potrebbe preannunciare una nuova era dell’It, derivante dalla convinzione che in futuro le aziende avranno sempre più bisogno di accedere a potenza di calcolo, a capacità di memorizzazione dei dati e all’utilizzo di applicazioni software, come se queste fossero delle utility  e quindi con modalità simili a quelle che oggi vengono impiegate dalle aziende per approvvigionarsi di acqua, elettricità o connettività telefonica. Ibm non fornirà quindi direttamente servizi ai possibili utenti di WebFountain, ma consentirà l’accesso on demand all’enorme quantità di informazioni raccolte ed elaborate a partner o ad altre aziende interessate sia ad usarli al loro interno, sia a mettere a disposizione di terzi output personalizzati riguardanti questo particolare tipo di business intelligence. Naturalmente Ibm darà tutta l’assistenza necessaria alle aziende che vorranno dotarsi di una loro infrastruttura WebFountain.

Carlo Cremona

Articolo 1 di 5