| 
       
        
      VISIBILITA' DEL SITO WEB DEL PROGETTO VOICE
        
       
      
       
       
           
      3.1 Come promuovere un sito Web 
          
        
      
      
       Le esigenze particolari degli utenti a cui VOICE 
      si rivolge hanno rappresentato un vincolo che, durante l'intera fase di 
      implementazione, ha influenzato in maniera determinante le scelte progettuali. 
      Un problema di carattere generale risulta essere, invece, quello relativo 
      alla visibilità del sito che, essendo indipendente dalla tipologia 
      di utenza considerata, deve essere preso in esame, in maniera più 
      o meno rilevante, da ciascun webmasters. L'unico approccio che può 
      essere adottato per tentare di risolvere tale problema ed incrementare così 
      il numero di visitatori di un sito Web è quello di avviare un'attenta 
      attività promozionale. In particolare questa può concretizzarsi 
      seguendo due differenti orientamenti: promozioni on-line e promozioni 
      off-line. Tutte le operazioni che mirano ad utilizzare e sfruttare 
      gli strumenti messi a disposizione dal mondo World Wide Web per indirizzare 
      utenti verso un determinato sito sono da annoverare tra le attività 
      previste dalla promozione on-line. In questo ambito l'attenzione degli sviluppatori 
      si concentra sulle operazioni di registrazione presso i motori di ricerca 
      e sull'utilizzo di forme elettroniche di pubblicità, i cosiddetti 
      banners. I webmasters che usufruiscono di quest'ultimo strumento hanno sostanzialmente 
      due possibilità: "affiggere" le loro pubblicità 
      in siti che forniscono questo tipo di servizio oppure in altri che trattano 
      un argomento analogo a quello del sito pubblicizzato. Il limite, per quanto 
      riguarda i banners, consiste nel fatto che per poter ottenere una buona 
      forma di pubblicità è spesso necessario rivolgersi a società 
      che offrono il servizio unicamente a pagamento. Al contrario, l'attività 
      promozionale off-line fa riferimento alle forme più tradizionali 
      di pubblicità. Tenendo presente la grande rilevanza che le maggiori 
      testate giornalistiche, non solo italiane ma anche internazionali, danno 
      al mondo Web è facile pensare ai vantaggi di cui potrebbe godere 
      un sito, in termini di aumento di traffico, per effetto di una buona recensione. 
      Sia l'attività promozionale on-line che quella off-line sono state 
      tenute in grande considerazione per migliorare la visibilità di VOICE. 
      Fra le varie possibilità si è scelto di focalizzare l'attenzione, 
      per quanto riguarda l'aspetto on-line, sull'uso corretto di alcuni motori 
      di ricerca mentre la partecipazione a conferenze ed incontri, anche a livello 
      internazionale, ha rappresentato una valida forma di promozione off-line. 
      
        
       3.2 Ricerche preliminari  
      
      Prima di avviare l'attività promozionale on-line, iniziata nell'ottobre 
      del 1998, si è ritenuto necessario effettuare alcune ricerche che 
      consentissero di creare dei presupposti solidi su cui poter basare i successivi 
      studi. In primo luogo, si è tentato di determinare l'effettivo traffico 
      relativo al sito VOICE. Utilizzando un software chiamato Analog si 
      sono analizzati i Log files presenti sul server che questo provvede a creare 
      o ad aggiornare ad ogni richiesta. L'utilità di tale operazione poteva 
      essere identificata nella possibilità di stabilire l'eventuale riuscita 
      della successiva attività di promozione, indipendentemente dal fatto 
      che questa fosse on-line oppure off-line. In secondo luogo, consultando 
      gli help in linea ed utilizzando correttamente alcuni dati reperibili in 
      rete, si è redatta la seguente tabella nella quale vengono indicate 
      le caratteristiche di alcuni tra i motori di ricerca maggiormente interrogati. 
      Occorre sottolineare che è stata volutamente tralasciata l'analisi 
      di Yahoo!; quest'ultimo non è un vero e proprio search engines, ma 
      piuttosto una directory che classifica i singoli siti raggruppandoli per 
      tipologia e permette all'utente di effettuare una ricerca partendo da macro 
      categorie, per poi approfondirla in base ad una struttura ad albero. 
      Si riporta tra gli allegati un documento HTML, 
      generato da Analog e scaricato direttamente da VOICE, nel quale sono 
      indicati gli accessi che hanno interessato il sito nel periodo di tempo 
      che intercorre tra maggio 1998 e gennaio 1999. 
      
        
        
       Tabella comparativa dei Motori di Ricerca maggiormente 
      interrogati 
      
        
       
       
       
          
            |  | Altavista | Exite | HotBot | Infoseek | Lycos | Northern | Web Crawler |  
            | Numero di pagine | 140 milioni | 60 milioni | 110 milioni | 30 milioni | 30 milioni | 50 milioni | 2 milioni |  
            | Versione italiana | SI | NO | NO | SI | SI | NO | NO |  
            | Ricerca avanzata | SI | SI | SI | SI | SI | NO | NO |  
            | Operatore standard | OR | AND | AND | OR | OR | AND | AND |  
            | Ricerca frasi | SI, usando gli apici | NO | SI, usando gli apici | SI, automatico | NO | NO | SI, usando gli apici |  
            | Plurale / Singolare | SI, usando "*" | Automatico (solo in inglese) | NO | Automatico (solo in inglese) | Automatico (solo in inglese) | NO | NO |  
            | Tempo di inserimento dei siti | 1-2 giorni | 3 settimane | 2-3 giorni | pochi minuti | 1-3 settimane | 2-4 settimane | 2-3 settimane |  
        
      Numero di pagine E' il numero totale delle pagine 
      indicizzato dal motore di ricerca. 
      
      Versione italiana Indica la disponibilità di una versione italiana.  
      
      Ricerca avanzata Indica se esistono delle funzioni avanzate di ricerca.  
      
      Operatore standard Ricerca le pagine contenenti tutte la parole immesse 
      (AND) oppure anche una sola di esse (OR).
       
       Ricerca di frasi Specifica se è possibile e come cercare 
      frasi composte da più termini.
       
       Plurale/Singolare Indica se le parole vengono ricercate anche nella 
      loro forma plurale.
       
       Tempi di inserimento dei siti E' il tempo che occorre, dal momento 
      della registrazione, al motore di ricerca per configurare correttamente 
      il sito.
       
        
      3.3 L'attività promozionale on-line relativa 
      al sito VOICE
         Partendo dal presupposto che i motori 
        di ricerca rappresentano il principale strumento a disposizione degli 
        utenti per il reperimento di informazioni in rete, l'attività promozionale 
        on-line relativa al sito VOICE è stata interamente concentrata 
        sull'uso di tali risorse. L'inserimento delle pagine 
        Web negli archivi dei motori di ricerca, può avvenire in due modi: 
        sia attraverso la registrazione manuale dell'utente (il responsabile del 
        sito per esempio), sia in modo automatico attraverso particolari softwares, 
        chiamati robots oppure spiders, che riescono a visitare milioni di siti 
        Web al giorno, inserendo le nuove pagine ed aggiornando le informazioni 
        su quelle già censite. Attraverso tale funzione, i motori di ricerca 
        mantengono un archivio piuttosto aggiornato, anche se nessuno riesce, 
        né riuscirà mai, a classificare l'intero Web. Basti pensare 
        che il numero massimo di pagine censite da Altavista, il motore con l'archivio 
        più completo, è di 140 milioni, contro una stima di 275 
        milioni di pagine che sembrano compongano in totale il Web. Questa operazione, 
        pur essendo di rilevante importanza, potrebbe risultare insufficiente 
        per risolvere in maniera ottimale il problema della visibilità. 
        Un sito, pur essendo registrato ed indicizzato in maniera corretta, potrebbe, 
        infatti, non occupare posizioni di rilievo all'interno degli indici generati 
        dai motori di ricerca per effetto di una interrogazione. Per sfruttare, 
        quindi, al meglio l'operazione di registrazione è consigliabile 
        applicare al codice HTML alcuni accorgimenti che possono 
        consentire di influenzare l'indicizzazione e, quindi, ottenere un "piazzamento" 
        più consono all'interno dei già citati indici. 
        Per il sito VOICE è stato seguito un orientamento analogo 
        ed in particolare ciascuna pagina è stata sviluppata, nel limite 
        del possibile, tenendo presente le seguenti indicazioni: 
       
           
        titolo della pagina: i motori di ricerca, solitamente, 
          assegnano molta importanza alle parole che sono posizionate all'interno 
          del tag <TITLE>. Tale caratteristica può 
          essere sfruttata positivamente. Inserendo nel titolo una breve descrizione 
          contenente le parole più significative del testo, si ha la certezza 
          che il relativo documento venga indicizzato in maniera migliore rispetto 
          al caso in cui le parole chiave compaiano solo nel corpo della pagina. 
          A questo va aggiunto che i motori di ricerca forniscono, quale risultato 
          di una interrogazione, una lista di titoli di documenti a cui sono associati 
          i relativi indirizzi. E' evidente, quindi, che una pagina riportante 
          il solo nome del sito, o addirittura non titolata, sarà per l'utente 
          meno interessante rispetto ad una in cui appare una breve descrizione 
          del documento; 
       
           
        Il tag <META> description 
        consente di specificare un breve sommario che appare al di sotto del titolo 
        della pagina a sua volta riportato nei risultati generati dai motori di 
        ricerca. Nel caso in cui questo tag non compaia nel codice HTML 
        i search engines, solitamente utilizzano le prime quindici/venti parole 
        presenti nel corpo della pagina. 	Il tag <META> 
        keywords consente di specificare le parole chiave che i robots 
        dovranno sfruttare per catalogare la pagina. Alle parole chiave indicate 
        in questo tag, solitamente, viene assegnata priorità minore rispetto 
        a quelle contenute nel titolo e priorità maggiore rispetto a quelle 
        riportate nel corpo della pagina. E' opportuno includere tra le parole 
        chiave sia termini generali sia specifici relativi al sito, le forme plurali 
        ed eventuali derivati. 	Per mostrare come gli accorgimenti 
        relativi al titolo e ai tags <META> sono stati 
        applicati nel sito VOICE si riporta di seguito uno stralcio del 
        codice HTML che compone la homepage:utilizzo dei tags <META>: 
          è possibile influenzare l'operazione di indicizzazione utilizzando 
          in maniera corretta i due tags <META>.  
        
         	<title>VOICE Homepage</title> 
        	<meta name="description"
         	content="VOICE Project: Voice to text recognition for helping the hearing 
          impaired. Joint Research Centre of the European Commission and associations 
          of the deaf.">		<meta name="keywords" 
        content="voice, text, speech, sound, recognition, deaf, hearing, 
          impaired, disabled, disability, elderly, special, needs, subtitles, 
          subtitling, television, telephone, communication, conferences, research, 
          european, commission, JRC, ISIS, TIDE, ISPO, NETDAYS"> 
          ; 
           
        non ripetere le parole chiave: la ripetizione 
          insistita delle parole chiave (indipendentemente dal fatto che questa 
          operazione venga effettuata nel titolo, nei tags <META> 
          oppure in maniera più nascosta all'interno di un background colorato) 
          è stata per lungo tempo uno stratagemma utilizzato dai webmasters 
          per ingannare i motori di ricerca. Questa tattica funzionava quando 
          i search engines erano poco sofisticati e catalogavano i siti calcolando 
          unicamente l'occorrenza delle parole chiave all'interno dei documenti. 
          Attualmente, invece, l'operazione di indicizzazione avviene tenendo 
          conto anche della densità della parola (rapporto tra 
          il numero di ripetizioni della parola all'interno della pagina ed il 
          totale di parole della pagina stessa) e della sua distribuzione 
          (come la parola è concentrata all'interno del documento). In 
          ultima analisi osserviamo che alcuni motori di ricerca tendono a declassare 
          il sito se sospettano che la ripetizione delle parole sia stata attuata 
          unicamente per migliorarne "la classifica"; 
       
          
        posizionare i concetti importanti all'inizio del documento: 
          questo accorgimento andrebbe attuato dal momento che alcuni motori di 
          ricerca, Lycos in particolare, assegnano una priorità maggiore 
          al testo che si trova nella parte iniziale della pagina da indicizzare. 
       Dopo aver analizzato ed opportunamente aggiornato il 
      codice HTML secondo le precedenti indicazioni, si è 
      provveduto ad effettuare l'operazione di registrazione manuale. Le scelte 
      per le quali si poteva optare erano sostanzialmente due: massimizzare il 
      numero di motori presso i quali effettuare la registrazione oppure concentrare 
      l'attenzione solo su alcuni di essi. La metodologia adottata avrebbe influito 
      anche sulla modalità da seguire per realizzare la registrazione. 
      Nel primo caso, infatti, si sarebbe dovuto ricorrere a Web promotion 
      software oppure a submission site che effettuano l'operazione 
      per conto dell'utente richiedendogli il titolo del sito, l'indirizzo Web 
      corrispondente, una breve descrizione e altre informazioni rilevanti. Il 
      numero di search engines presi in considerazione da questi programmi può 
      arrivare fino a 250. Nel secondo caso si sarebbe dovuta effettuare la registrazione 
      compilando i formulari messi a disposizione da ciascun motore di ricerca. 
      Tra le due alternative i gestori del sito VOICE hanno optato per 
      quest'ultima ritenendola, almeno allo stato attuale, più opportuna 
      e maggiormente mirata. Le modalità utilizzate per codificare le pagine 
      che compongono il sito e la successiva registrazione hanno portato a significativi 
      risultati in sede di interrogazione dei motori di ricerca. Tra gli allegati 
      si riportano alcuni esempi di interrogazioni effettuate dai responsabili 
      del sito variando tanto il motore di ricerca quanto le parole o le frasi 
      da sottoporre ai motori stessi. |