I bisogni degli utenti audiolesi per il prototipo di sottotitolazione VOICE |
Lo schema La scaletta delle interviste Le risposte Catturare il testo generato per un successivo utilizzo a fini didattici Video-registrare l'intera conferenza sottotitolata per un utilizzo successivo Semplicità d'uso della sottotitolazione: addestramento del parlatore Semplicità d'uso della sottotitolazione: utilizzo da parte di più persone Semplicità d'uso della sottotitolazione: accessori multimediali Permanenza dei sottotitoli per un tempo sufficiente alla loro lettura Altezza, colore, carattere dei sottotitoli Sfondo Lingue Conclusioni Riportiamo i risultati dell'indagine condotta allo scopo di indirizzare
la programmazione del prototipo verso scelte che potessero coprire
le esigenze di sottotitolazione degli utenti (sordi, sordastri e
anziani). I primi colloqui per la costruzione dello schema
di intervista sono stati effettuati solo con persone rappresentanti
le Associazioni. Gli interlocutori sono stati scelti in base ad
un livello di conoscenza (o meglio di sintesi di conoscenze) che
potesse rapidamente permettere la costruzione della scaletta di
intervista. Questa fase è stata impostata ed eseguita
da Giuliano Pirelli del CCR-ISIS e da Angelo Paglino della Software
House FBL. Dopo alcuni mesi, abbiamo allargato il campo delle interviste alle scuole, allo scopo di avere una opinione più neutra ed un controllo più ampio. Sono state così effettuati 8 ulteriori incontri con 4 scuole, anche in questo caso prima con alcuni insegnanti, poi con il dirigente scolastico. Le scuole interessate all'indagine sono state: la Scuola Elementare di Arona II, il Liceo Artistico di Varese, il Liceo Scientifico di Mortara e il Liceo Scientifico di Ravenna. Gli argomenti da trattare con gli intervistati sono
stati riassunti nella seguente scaletta.
Va notato come le caratteristiche (altezza, colore, carattere, sfondo) siano state lasciate in chiusura di conversazione, pur sembrando gli argomenti più ovvi da trattare. Le interviste sono state eseguite durante le manifestazioni
di presentazione del progetto Voice, per l'input iniziale, e poi
durante le manifestazioni in cui il prototipo è stato utilizzato
per una messa a punto del dimostratore. Da questa interazione regolare fra sviluppatori
ed utenti finali è scaturita una serie di richieste, che
via via sono state realizzate, in tempi mediamente brevi, ed immediatamente
riproposte all'utenza per una validazione ulteriore. Non è possibile indicare il numero esatto
d'interviste effettuate, poiché spesse volte partecipavano
al colloquio più persone. Dagli appunti degli intervistatori
possiamo indicare in 283 i colloqui effettuati. Il numero è
rilevante: è stato possibile raccogliere tante informazioni
e giudizi in quanto ognuna delle quasi 100 manifestazioni (conferenze,
seminari, incontri con le classi) è stata preceduta e seguita
da una o più sessioni d'indagine. I risultati delle interviste sono stati oggetto
di confronto durante 8 sessioni svolte a Ispra. Va subito detto che nelle 8 sessioni di controllo non sono emersi particolari suggerimenti, ma soprattutto è stata confermata l'accettazione del prototipo stesso e delle scelte di programmazione. Sono inoltre state segnalate delle necessità specifiche difficilmente prevedibili, perchè corrispondenti a casi molto particolari: per es. contrasto molto accentuato e caratteri molto grandi per ipovedenti e tecniche specifiche per l'addestramento dei non vedenti. Si è dovuto, ad un certo punto, privilegiare gli incontri con gli insegnanti e con i medici rispetto ai sordi, poiché questi ultimi si dimostravano particolarmente affascinati dalla novità della sottotitolatura in diretta e di conseguenza poco propensi a effettuare analisi critiche. Catturare il testo generato per un successivo utilizzo a fini didattici Abbiamo già osservato che la richiesta ci
ha colti un poco di sorpresa, non tanto per la richiesta in se stessa,
quanto per l'alta priorità assegnatale. Dal nostro punto di vista (tecnico), il disporre
su supporto magnetico (file di testo) della lezione permette un
più rapido e preciso addestramento del parlatore, potendo
far esaminare al motore di riconoscimento un linguaggio, cioè
le espressioni (forma e contenuti) di una certa materia di studio.
Ancora: essendo il testo in formato elettronico, è facile la correzione di eventuali errori e la formattazione del testo stesso prima di produrre una stampa. L'archiviazione del solo testo non comporta problemi di spazio sul computer, mentre la conservazione di file vocali impegna notevoli risorse disco. Video-registrare l'intera conferenza sottotitolata per un utilizzo successivo (archivio) Poter disporre di una video-cassetta sottotitolata è sembrata una richiesta abbastanza "normale", poiché spesso le conferenze (e talvolta le lezioni) vengono filmate e successivamente sottotitolate. L'attenzione si è posata sulle possibilità
di errore del riconoscitore: durante le sessioni di controllo si
è potuto verificare come l'evoluzione del motore di riconoscimento
abbia di fatto diminuito notevolmente questa preoccupazione, anche
se permangono alcuni errori. Una richiesta particolare è stata la seguente: aggiungere al file di testo un "time code" che permetta, una volta corretti gli eventuali errori, tramite un programma da sviluppare ad hoc, la creazione di un video sottotitolato partendo da due input: la video-cassetta ed il file di testo (corretto!). Semplicità d'uso della sottotitolazione: addestramento del parlatore (facile e veloce) Il motore di riconoscimento utilizzato nel dimostratore
ha un suo meccanismo per acquisire informazioni sulla voce del parlatore
e, essendo Voice Dependent, per ottimizzarne la comprensione.
Più complesso, ma molto ben accettato e con
un grado di soddisfazione sempre superiore, si è dimostrato
l'addestramento alla gestione delle pause: la quasi totalità
delle persone addestrate ha convenuto che il sistema, imponendo
dei ritmi (dovuti alla necessità di leggere i sottotitoli)
e delle regole di pronuncia (per migliorare il riconoscimento) induce
un miglioramento nel modo di esprimersi. Questa osservazione viene
fatta soprattutto da parte degli insegnanti.
Non sarà necessario utilizzare, durante la lezione, le stesse frasi che sono state preparate, ma sarà importante utilizzare lo stesso stile (parole e contesto). Semplicità d'uso della sottotitolazione: utilizzo da parte di più persone, in successione, e talvolta, contemporaneamente La richiesta di contemporaneità nasce dalle sale di conferenza:
durante un dibattito sarebbe bello poter sottotitolare tutti gli
interventi, anche contemporanei. Semplicità d'uso della sottotitolazione: accessori multimediali (slides, video, suoni) per mantenere alta l'attenzione dell'uditorio L'idea di introdurre ausili multimediali durante
la sottotitolazione di una lezione non è partita dall'utenza,
ma dalla programmazione. Permanenza dei sottotitoli per un tempo sufficiente alla loro lettura Il problema è stato evidenziato dagli utenti,
che spesso non riescono a leggere i sottotitoli perché la
loro permanenza sullo schermo è troppo breve. Le vie per raggiungere il risultato sono due, ed entrambe sono state messe in atto.
Data l'impossibilità di determinare un valore medio ottimale, il programmatore ha scelto di mettere a disposizione del parlatore una "regolazione" che prevede valori da 1 a 50 cps. Altezza, colore, carattere dei sottotitoli Esistono degli standard televisivi, ma sono legati, non solo in Italia, all'uso del televideo per sottotitolare le trasmissioni. È la trasmissione ancora analogica che richiede l'uso della sottotitolazione tramite televideo, mentre la trasmissione digitale amplierà le possibilità offerte alle reti televisive di andare incontro ai fabbisogni dell'utenza. Lo standard oggi adottato è di 35 caratteri
per riga e una o due righe. La differenza di colore che contraddistingue i dialoghi
è utilizzata solo nelle sottotitolature di film per la televisione
e non nei telegiornali. Di un argomento si è discusso in particolare: l'uso del maiuscolo o del minuscolo nei sottotitoli. Gli utenti sono equamente divisi sulla scelta da adottare, con una leggera prevalenza per il TUTTO MAIUSCOLO che sembra più leggibile e non crea problemi con i nomi propri. Abbiamo affrontato i problemi:
Ma non siamo riusciti ad avere indicazioni, se non
generiche, del tipo "la riga che scorre verso l'alto provoca
un effetto mal di mare", "la lettura del testo che scorre
è troppo stancante ","tre righe sono troppe, ma
non so dire perché". Sono stati monitorati anche gli aspetti ambientali: l'insegnante o l'oratore parlano rivolti verso la classe o il pubblico, una telecamera li riprende fornendo spesso immagini in primo piano che consentono la lettura labiale. L'ambiente ottimale è stato descritto nel seguente modo:
Sono da tenere sotto controllo, a scuola, le luci:
la classe deve lavorare in un ambiente luminoso, perciò il
proiettore deve avere una sufficiente potenza (700 lumen). "Colorato o trasparente questo è il dilemma" potremmo
recitare con il poeta. Il criterio utilizzato per la scelta dell'utente è lo stesso applicato per la selezione della lingua descritto precedentemente. Occorre aver installato il motore di riconoscimento in tutte le lingue in cui si intende sottotitolare: il dimostratore è stato testato in cinque lingue: Italiano, Inglese, Francese, Tedesco e Spagnolo. È possibile aggiungere altre lingue a condizione che esista la versione del motore di riconoscimento. In alcuni casi, Scuole Medie Superiori, è
stato adottato il prodotto in più lingue per far fronte all'esigenza
di insegnamento di una lingua straniera. Il livello globale di accettazione del dimostratore si è dimostrato molto buono. Come si è indicato precedentemente, gli utenti delle Associazioni di audiolesi lo hanno considerato pienamente corrispondente alle loro esigenze. Pareri contrastanti sono stati rilevati solo all'interno di gruppi
di insegnanti: alcuni, la maggior parte, ha accettato di utilizzare
il sistema di sottotitolatura pur sapendo che, almeno inizialmente,
avrebbe provocato loro un maggior carico di lavoro, dovendo preparare
lezioni improntate alla multimedialità, effettuare prove
e ricercare i ritmi più adatti alla gestione delle pause.
Altro carico di lavoro deriva dalla preparazione delle immagini
e dei filmati da utilizzare durante la lezione. |
<TOP> <Home> <Progetti> <TAP> <Bisogni utenti> |