Capitolo 3

  VISIBILITA' DEL SITO WEB DEL PROGETTO VOICE

 

3.1 Come promuovere un sito Web

Le esigenze particolari degli utenti a cui VOICE si rivolge hanno rappresentato un vincolo che, durante l'intera fase di implementazione, ha influenzato in maniera determinante le scelte progettuali. Un problema di carattere generale risulta essere, invece, quello relativo alla visibilità del sito che, essendo indipendente dalla tipologia di utenza considerata, deve essere preso in esame, in maniera più o meno rilevante, da ciascun webmasters. L'unico approccio che può essere adottato per tentare di risolvere tale problema ed incrementare così il numero di visitatori di un sito Web è quello di avviare un'attenta attività promozionale. In particolare questa può concretizzarsi seguendo due differenti orientamenti: promozioni on-line e promozioni off-line. Tutte le operazioni che mirano ad utilizzare e sfruttare gli strumenti messi a disposizione dal mondo World Wide Web per indirizzare utenti verso un determinato sito sono da annoverare tra le attività previste dalla promozione on-line. In questo ambito l'attenzione degli sviluppatori si concentra sulle operazioni di registrazione presso i motori di ricerca e sull'utilizzo di forme elettroniche di pubblicità, i cosiddetti banners. I webmasters che usufruiscono di quest'ultimo strumento hanno sostanzialmente due possibilità: "affiggere" le loro pubblicità in siti che forniscono questo tipo di servizio oppure in altri che trattano un argomento analogo a quello del sito pubblicizzato. Il limite, per quanto riguarda i banners, consiste nel fatto che per poter ottenere una buona forma di pubblicità è spesso necessario rivolgersi a società che offrono il servizio unicamente a pagamento. Al contrario, l'attività promozionale off-line fa riferimento alle forme più tradizionali di pubblicità. Tenendo presente la grande rilevanza che le maggiori testate giornalistiche, non solo italiane ma anche internazionali, danno al mondo Web è facile pensare ai vantaggi di cui potrebbe godere un sito, in termini di aumento di traffico, per effetto di una buona recensione. Sia l'attività promozionale on-line che quella off-line sono state tenute in grande considerazione per migliorare la visibilità di VOICE. Fra le varie possibilità si è scelto di focalizzare l'attenzione, per quanto riguarda l'aspetto on-line, sull'uso corretto di alcuni motori di ricerca mentre la partecipazione a conferenze ed incontri, anche a livello internazionale, ha rappresentato una valida forma di promozione off-line.

  3.2 Ricerche preliminari

Prima di avviare l'attività promozionale on-line, iniziata nell'ottobre del 1998, si è ritenuto necessario effettuare alcune ricerche che consentissero di creare dei presupposti solidi su cui poter basare i successivi studi. In primo luogo, si è tentato di determinare l'effettivo traffico relativo al sito VOICE. Utilizzando un software chiamato Analog si sono analizzati i Log files presenti sul server che questo provvede a creare o ad aggiornare ad ogni richiesta. L'utilità di tale operazione poteva essere identificata nella possibilità di stabilire l'eventuale riuscita della successiva attività di promozione, indipendentemente dal fatto che questa fosse on-line oppure off-line. In secondo luogo, consultando gli help in linea ed utilizzando correttamente alcuni dati reperibili in rete, si è redatta la seguente tabella nella quale vengono indicate le caratteristiche di alcuni tra i motori di ricerca maggiormente interrogati. Occorre sottolineare che è stata volutamente tralasciata l'analisi di Yahoo!; quest'ultimo non è un vero e proprio search engines, ma piuttosto una directory che classifica i singoli siti raggruppandoli per tipologia e permette all'utente di effettuare una ricerca partendo da macro categorie, per poi approfondirla in base ad una struttura ad albero. Si riporta tra gli allegati un documento HTML, generato da Analog e scaricato direttamente da VOICE, nel quale sono indicati gli accessi che hanno interessato il sito nel periodo di tempo che intercorre tra maggio 1998 e gennaio 1999.

 

  Tabella comparativa dei Motori di Ricerca maggiormente interrogati

 

  Altavista Exite HotBot Infoseek Lycos Northern Web Crawler
Numero di pagine 140 milioni 60 milioni 110 milioni 30 milioni 30 milioni 50 milioni 2 milioni
Versione italiana SI NO NO SI SI NO NO
Ricerca avanzata SI SI SI SI SI NO NO
Operatore standard OR AND AND OR OR AND AND
Ricerca frasi SI, usando gli apici NO SI, usando gli apici SI, automatico NO NO SI, usando gli apici
Plurale / Singolare SI, usando "*" Automatico (solo in inglese) NO Automatico (solo in inglese) Automatico (solo in inglese) NO NO
Tempo di inserimento dei siti 1-2 giorni 3 settimane 2-3 giorni pochi minuti 1-3 settimane 2-4 settimane 2-3 settimane

  Numero di pagine E' il numero totale delle pagine indicizzato dal motore di ricerca.

Versione italiana Indica la disponibilità di una versione italiana.

Ricerca avanzata Indica se esistono delle funzioni avanzate di ricerca.

Operatore standard Ricerca le pagine contenenti tutte la parole immesse (AND) oppure anche una sola di esse (OR).

Ricerca di frasi Specifica se è possibile e come cercare frasi composte da più termini.

Plurale/Singolare Indica se le parole vengono ricercate anche nella loro forma plurale.

Tempi di inserimento dei siti E' il tempo che occorre, dal momento della registrazione, al motore di ricerca per configurare correttamente il sito.

  3.3 L'attività promozionale on-line relativa al sito VOICE

Partendo dal presupposto che i motori di ricerca rappresentano il principale strumento a disposizione degli utenti per il reperimento di informazioni in rete, l'attività promozionale on-line relativa al sito VOICE è stata interamente concentrata sull'uso di tali risorse. L'inserimento delle pagine Web negli archivi dei motori di ricerca, può avvenire in due modi: sia attraverso la registrazione manuale dell'utente (il responsabile del sito per esempio), sia in modo automatico attraverso particolari softwares, chiamati robots oppure spiders, che riescono a visitare milioni di siti Web al giorno, inserendo le nuove pagine ed aggiornando le informazioni su quelle già censite. Attraverso tale funzione, i motori di ricerca mantengono un archivio piuttosto aggiornato, anche se nessuno riesce, né riuscirà mai, a classificare l'intero Web. Basti pensare che il numero massimo di pagine censite da Altavista, il motore con l'archivio più completo, è di 140 milioni, contro una stima di 275 milioni di pagine che sembrano compongano in totale il Web. Questa operazione, pur essendo di rilevante importanza, potrebbe risultare insufficiente per risolvere in maniera ottimale il problema della visibilità. Un sito, pur essendo registrato ed indicizzato in maniera corretta, potrebbe, infatti, non occupare posizioni di rilievo all'interno degli indici generati dai motori di ricerca per effetto di una interrogazione. Per sfruttare, quindi, al meglio l'operazione di registrazione è consigliabile applicare al codice HTML alcuni accorgimenti che possono consentire di influenzare l'indicizzazione e, quindi, ottenere un "piazzamento" più consono all'interno dei già citati indici. Per il sito VOICE è stato seguito un orientamento analogo ed in particolare ciascuna pagina è stata sviluppata, nel limite del possibile, tenendo presente le seguenti indicazioni:

  1. titolo della pagina: i motori di ricerca, solitamente, assegnano molta importanza alle parole che sono posizionate all'interno del tag <TITLE>. Tale caratteristica può essere sfruttata positivamente. Inserendo nel titolo una breve descrizione contenente le parole più significative del testo, si ha la certezza che il relativo documento venga indicizzato in maniera migliore rispetto al caso in cui le parole chiave compaiano solo nel corpo della pagina. A questo va aggiunto che i motori di ricerca forniscono, quale risultato di una interrogazione, una lista di titoli di documenti a cui sono associati i relativi indirizzi. E' evidente, quindi, che una pagina riportante il solo nome del sito, o addirittura non titolata, sarà per l'utente meno interessante rispetto ad una in cui appare una breve descrizione del documento;

  1. utilizzo dei tags <META>: è possibile influenzare l'operazione di indicizzazione utilizzando in maniera corretta i due tags <META>.
Il tag <META> description consente di specificare un breve sommario che appare al di sotto del titolo della pagina a sua volta riportato nei risultati generati dai motori di ricerca. Nel caso in cui questo tag non compaia nel codice HTML i search engines, solitamente utilizzano le prime quindici/venti parole presenti nel corpo della pagina. Il tag <META> keywords consente di specificare le parole chiave che i robots dovranno sfruttare per catalogare la pagina. Alle parole chiave indicate in questo tag, solitamente, viene assegnata priorità minore rispetto a quelle contenute nel titolo e priorità maggiore rispetto a quelle riportate nel corpo della pagina. E' opportuno includere tra le parole chiave sia termini generali sia specifici relativi al sito, le forme plurali ed eventuali derivati. Per mostrare come gli accorgimenti relativi al titolo e ai tags <META> sono stati applicati nel sito VOICE si riporta di seguito uno stralcio del codice HTML che compone la homepage:

<title>VOICE Homepage</title> <meta name="description"

content="VOICE Project: Voice to text recognition for helping the hearing impaired. Joint Research Centre of the European Commission and associations of the deaf."> <meta name="keywords" content="voice, text, speech, sound, recognition, deaf, hearing, impaired, disabled, disability, elderly, special, needs, subtitles, subtitling, television, telephone, communication, conferences, research, european, commission, JRC, ISIS, TIDE, ISPO, NETDAYS">

;
  1. non ripetere le parole chiave: la ripetizione insistita delle parole chiave (indipendentemente dal fatto che questa operazione venga effettuata nel titolo, nei tags <META> oppure in maniera più nascosta all'interno di un background colorato) è stata per lungo tempo uno stratagemma utilizzato dai webmasters per ingannare i motori di ricerca. Questa tattica funzionava quando i search engines erano poco sofisticati e catalogavano i siti calcolando unicamente l'occorrenza delle parole chiave all'interno dei documenti. Attualmente, invece, l'operazione di indicizzazione avviene tenendo conto anche della densità della parola (rapporto tra il numero di ripetizioni della parola all'interno della pagina ed il totale di parole della pagina stessa) e della sua distribuzione (come la parola è concentrata all'interno del documento). In ultima analisi osserviamo che alcuni motori di ricerca tendono a declassare il sito se sospettano che la ripetizione delle parole sia stata attuata unicamente per migliorarne "la classifica";

  1. posizionare i concetti importanti all'inizio del documento: questo accorgimento andrebbe attuato dal momento che alcuni motori di ricerca, Lycos in particolare, assegnano una priorità maggiore al testo che si trova nella parte iniziale della pagina da indicizzare.

Dopo aver analizzato ed opportunamente aggiornato il codice HTML secondo le precedenti indicazioni, si è provveduto ad effettuare l'operazione di registrazione manuale. Le scelte per le quali si poteva optare erano sostanzialmente due: massimizzare il numero di motori presso i quali effettuare la registrazione oppure concentrare l'attenzione solo su alcuni di essi. La metodologia adottata avrebbe influito anche sulla modalità da seguire per realizzare la registrazione. Nel primo caso, infatti, si sarebbe dovuto ricorrere a Web promotion software oppure a submission site che effettuano l'operazione per conto dell'utente richiedendogli il titolo del sito, l'indirizzo Web corrispondente, una breve descrizione e altre informazioni rilevanti. Il numero di search engines presi in considerazione da questi programmi può arrivare fino a 250. Nel secondo caso si sarebbe dovuta effettuare la registrazione compilando i formulari messi a disposizione da ciascun motore di ricerca. Tra le due alternative i gestori del sito VOICE hanno optato per quest'ultima ritenendola, almeno allo stato attuale, più opportuna e maggiormente mirata. Le modalità utilizzate per codificare le pagine che compongono il sito e la successiva registrazione hanno portato a significativi risultati in sede di interrogazione dei motori di ricerca. Tra gli allegati si riportano alcuni esempi di interrogazioni effettuate dai responsabili del sito variando tanto il motore di ricerca quanto le parole o le frasi da sottoporre ai motori stessi.

<TOP> <Indice>