VISIBILITA' DEL SITO WEB DEL PROGETTO VOICE
3.1 Come promuovere un sito Web
Le esigenze particolari degli utenti a cui VOICE
si rivolge hanno rappresentato un vincolo che, durante l'intera fase di
implementazione, ha influenzato in maniera determinante le scelte progettuali.
Un problema di carattere generale risulta essere, invece, quello relativo
alla visibilità del sito che, essendo indipendente dalla tipologia
di utenza considerata, deve essere preso in esame, in maniera più
o meno rilevante, da ciascun webmasters. L'unico approccio che può
essere adottato per tentare di risolvere tale problema ed incrementare così
il numero di visitatori di un sito Web è quello di avviare un'attenta
attività promozionale. In particolare questa può concretizzarsi
seguendo due differenti orientamenti: promozioni on-line e promozioni
off-line. Tutte le operazioni che mirano ad utilizzare e sfruttare
gli strumenti messi a disposizione dal mondo World Wide Web per indirizzare
utenti verso un determinato sito sono da annoverare tra le attività
previste dalla promozione on-line. In questo ambito l'attenzione degli sviluppatori
si concentra sulle operazioni di registrazione presso i motori di ricerca
e sull'utilizzo di forme elettroniche di pubblicità, i cosiddetti
banners. I webmasters che usufruiscono di quest'ultimo strumento hanno sostanzialmente
due possibilità: "affiggere" le loro pubblicità
in siti che forniscono questo tipo di servizio oppure in altri che trattano
un argomento analogo a quello del sito pubblicizzato. Il limite, per quanto
riguarda i banners, consiste nel fatto che per poter ottenere una buona
forma di pubblicità è spesso necessario rivolgersi a società
che offrono il servizio unicamente a pagamento. Al contrario, l'attività
promozionale off-line fa riferimento alle forme più tradizionali
di pubblicità. Tenendo presente la grande rilevanza che le maggiori
testate giornalistiche, non solo italiane ma anche internazionali, danno
al mondo Web è facile pensare ai vantaggi di cui potrebbe godere
un sito, in termini di aumento di traffico, per effetto di una buona recensione.
Sia l'attività promozionale on-line che quella off-line sono state
tenute in grande considerazione per migliorare la visibilità di VOICE.
Fra le varie possibilità si è scelto di focalizzare l'attenzione,
per quanto riguarda l'aspetto on-line, sull'uso corretto di alcuni motori
di ricerca mentre la partecipazione a conferenze ed incontri, anche a livello
internazionale, ha rappresentato una valida forma di promozione off-line.
3.2 Ricerche preliminari
Prima di avviare l'attività promozionale on-line, iniziata nell'ottobre
del 1998, si è ritenuto necessario effettuare alcune ricerche che
consentissero di creare dei presupposti solidi su cui poter basare i successivi
studi. In primo luogo, si è tentato di determinare l'effettivo traffico
relativo al sito VOICE. Utilizzando un software chiamato Analog si
sono analizzati i Log files presenti sul server che questo provvede a creare
o ad aggiornare ad ogni richiesta. L'utilità di tale operazione poteva
essere identificata nella possibilità di stabilire l'eventuale riuscita
della successiva attività di promozione, indipendentemente dal fatto
che questa fosse on-line oppure off-line. In secondo luogo, consultando
gli help in linea ed utilizzando correttamente alcuni dati reperibili in
rete, si è redatta la seguente tabella nella quale vengono indicate
le caratteristiche di alcuni tra i motori di ricerca maggiormente interrogati.
Occorre sottolineare che è stata volutamente tralasciata l'analisi
di Yahoo!; quest'ultimo non è un vero e proprio search engines, ma
piuttosto una directory che classifica i singoli siti raggruppandoli per
tipologia e permette all'utente di effettuare una ricerca partendo da macro
categorie, per poi approfondirla in base ad una struttura ad albero.
Si riporta tra gli allegati un documento HTML,
generato da Analog e scaricato direttamente da VOICE, nel quale sono
indicati gli accessi che hanno interessato il sito nel periodo di tempo
che intercorre tra maggio 1998 e gennaio 1999.
Tabella comparativa dei Motori di Ricerca maggiormente
interrogati
|
Altavista |
Exite |
HotBot |
Infoseek |
Lycos |
Northern |
Web Crawler |
Numero di pagine |
140 milioni |
60 milioni |
110 milioni |
30 milioni |
30 milioni |
50 milioni |
2 milioni |
Versione italiana |
SI |
NO |
NO |
SI |
SI |
NO |
NO |
Ricerca avanzata |
SI |
SI |
SI |
SI |
SI |
NO |
NO |
Operatore standard |
OR |
AND |
AND |
OR |
OR |
AND |
AND |
Ricerca frasi |
SI, usando gli apici |
NO |
SI, usando gli apici |
SI, automatico |
NO |
NO |
SI, usando gli apici |
Plurale / Singolare |
SI, usando "*" |
Automatico (solo in inglese) |
NO |
Automatico (solo in inglese) |
Automatico (solo in inglese) |
NO |
NO |
Tempo di inserimento dei siti |
1-2 giorni |
3 settimane |
2-3 giorni |
pochi minuti |
1-3 settimane |
2-4 settimane |
2-3 settimane |
Numero di pagine E' il numero totale delle pagine
indicizzato dal motore di ricerca.
Versione italiana Indica la disponibilità di una versione italiana.
Ricerca avanzata Indica se esistono delle funzioni avanzate di ricerca.
Operatore standard Ricerca le pagine contenenti tutte la parole immesse
(AND) oppure anche una sola di esse (OR).
Ricerca di frasi Specifica se è possibile e come cercare
frasi composte da più termini.
Plurale/Singolare Indica se le parole vengono ricercate anche nella
loro forma plurale.
Tempi di inserimento dei siti E' il tempo che occorre, dal momento
della registrazione, al motore di ricerca per configurare correttamente
il sito.
3.3 L'attività promozionale on-line relativa
al sito VOICE
Partendo dal presupposto che i motori
di ricerca rappresentano il principale strumento a disposizione degli
utenti per il reperimento di informazioni in rete, l'attività promozionale
on-line relativa al sito VOICE è stata interamente concentrata
sull'uso di tali risorse. L'inserimento delle pagine
Web negli archivi dei motori di ricerca, può avvenire in due modi:
sia attraverso la registrazione manuale dell'utente (il responsabile del
sito per esempio), sia in modo automatico attraverso particolari softwares,
chiamati robots oppure spiders, che riescono a visitare milioni di siti
Web al giorno, inserendo le nuove pagine ed aggiornando le informazioni
su quelle già censite. Attraverso tale funzione, i motori di ricerca
mantengono un archivio piuttosto aggiornato, anche se nessuno riesce,
né riuscirà mai, a classificare l'intero Web. Basti pensare
che il numero massimo di pagine censite da Altavista, il motore con l'archivio
più completo, è di 140 milioni, contro una stima di 275
milioni di pagine che sembrano compongano in totale il Web. Questa operazione,
pur essendo di rilevante importanza, potrebbe risultare insufficiente
per risolvere in maniera ottimale il problema della visibilità.
Un sito, pur essendo registrato ed indicizzato in maniera corretta, potrebbe,
infatti, non occupare posizioni di rilievo all'interno degli indici generati
dai motori di ricerca per effetto di una interrogazione. Per sfruttare,
quindi, al meglio l'operazione di registrazione è consigliabile
applicare al codice HTML alcuni accorgimenti che possono
consentire di influenzare l'indicizzazione e, quindi, ottenere un "piazzamento"
più consono all'interno dei già citati indici.
Per il sito VOICE è stato seguito un orientamento analogo
ed in particolare ciascuna pagina è stata sviluppata, nel limite
del possibile, tenendo presente le seguenti indicazioni:
- titolo della pagina: i motori di ricerca, solitamente,
assegnano molta importanza alle parole che sono posizionate all'interno
del tag <TITLE>. Tale caratteristica può
essere sfruttata positivamente. Inserendo nel titolo una breve descrizione
contenente le parole più significative del testo, si ha la certezza
che il relativo documento venga indicizzato in maniera migliore rispetto
al caso in cui le parole chiave compaiano solo nel corpo della pagina.
A questo va aggiunto che i motori di ricerca forniscono, quale risultato
di una interrogazione, una lista di titoli di documenti a cui sono associati
i relativi indirizzi. E' evidente, quindi, che una pagina riportante
il solo nome del sito, o addirittura non titolata, sarà per l'utente
meno interessante rispetto ad una in cui appare una breve descrizione
del documento;
- utilizzo dei tags <META>:
è possibile influenzare l'operazione di indicizzazione utilizzando
in maniera corretta i due tags <META>.
Il tag <META> description
consente di specificare un breve sommario che appare al di sotto del titolo
della pagina a sua volta riportato nei risultati generati dai motori di
ricerca. Nel caso in cui questo tag non compaia nel codice HTML
i search engines, solitamente utilizzano le prime quindici/venti parole
presenti nel corpo della pagina. Il tag <META>
keywords consente di specificare le parole chiave che i robots
dovranno sfruttare per catalogare la pagina. Alle parole chiave indicate
in questo tag, solitamente, viene assegnata priorità minore rispetto
a quelle contenute nel titolo e priorità maggiore rispetto a quelle
riportate nel corpo della pagina. E' opportuno includere tra le parole
chiave sia termini generali sia specifici relativi al sito, le forme plurali
ed eventuali derivati. Per mostrare come gli accorgimenti
relativi al titolo e ai tags <META> sono stati
applicati nel sito VOICE si riporta di seguito uno stralcio del
codice HTML che compone la homepage:
<title>VOICE Homepage</title>
<meta name="description"
content="VOICE Project: Voice to text recognition for helping the hearing
impaired. Joint Research Centre of the European Commission and associations
of the deaf."> <meta name="keywords"
content="voice, text, speech, sound, recognition, deaf, hearing,
impaired, disabled, disability, elderly, special, needs, subtitles,
subtitling, television, telephone, communication, conferences, research,
european, commission, JRC, ISIS, TIDE, ISPO, NETDAYS">
;
- non ripetere le parole chiave: la ripetizione
insistita delle parole chiave (indipendentemente dal fatto che questa
operazione venga effettuata nel titolo, nei tags <META>
oppure in maniera più nascosta all'interno di un background colorato)
è stata per lungo tempo uno stratagemma utilizzato dai webmasters
per ingannare i motori di ricerca. Questa tattica funzionava quando
i search engines erano poco sofisticati e catalogavano i siti calcolando
unicamente l'occorrenza delle parole chiave all'interno dei documenti.
Attualmente, invece, l'operazione di indicizzazione avviene tenendo
conto anche della densità della parola (rapporto tra
il numero di ripetizioni della parola all'interno della pagina ed il
totale di parole della pagina stessa) e della sua distribuzione
(come la parola è concentrata all'interno del documento). In
ultima analisi osserviamo che alcuni motori di ricerca tendono a declassare
il sito se sospettano che la ripetizione delle parole sia stata attuata
unicamente per migliorarne "la classifica";
- posizionare i concetti importanti all'inizio del documento:
questo accorgimento andrebbe attuato dal momento che alcuni motori di
ricerca, Lycos in particolare, assegnano una priorità maggiore
al testo che si trova nella parte iniziale della pagina da indicizzare.
Dopo aver analizzato ed opportunamente aggiornato il
codice HTML secondo le precedenti indicazioni, si è
provveduto ad effettuare l'operazione di registrazione manuale. Le scelte
per le quali si poteva optare erano sostanzialmente due: massimizzare il
numero di motori presso i quali effettuare la registrazione oppure concentrare
l'attenzione solo su alcuni di essi. La metodologia adottata avrebbe influito
anche sulla modalità da seguire per realizzare la registrazione.
Nel primo caso, infatti, si sarebbe dovuto ricorrere a Web promotion
software oppure a submission site che effettuano l'operazione
per conto dell'utente richiedendogli il titolo del sito, l'indirizzo Web
corrispondente, una breve descrizione e altre informazioni rilevanti. Il
numero di search engines presi in considerazione da questi programmi può
arrivare fino a 250. Nel secondo caso si sarebbe dovuta effettuare la registrazione
compilando i formulari messi a disposizione da ciascun motore di ricerca.
Tra le due alternative i gestori del sito VOICE hanno optato per
quest'ultima ritenendola, almeno allo stato attuale, più opportuna
e maggiormente mirata. Le modalità utilizzate per codificare le pagine
che compongono il sito e la successiva registrazione hanno portato a significativi
risultati in sede di interrogazione dei motori di ricerca. Tra gli allegati
si riportano alcuni esempi di interrogazioni effettuate dai responsabili
del sito variando tanto il motore di ricerca quanto le parole o le frasi
da sottoporre ai motori stessi. |