La trascrizione era una volta un processo manuale e noioso. Medici, giornalisti e un gruppo di professionisti assortiti registravano i loro appunti e le conversazioni su nastro graffiante del dittafono e poi si siedevano davanti ai loro computer per batterli.
Passa rapidamente al 2020 e ci sono una varietà di servizi che puoi utilizzare per trasformare una registrazione audio in testo sullo schermo di un computer. Tuttavia, rimane una domanda: sono al sicuro? Dopotutto, potresti caricare registrazioni vocali di conversazioni sensibili e messaggi vocali privati.
Diamo un'occhiata a questi servizi e a come puoi proteggere le tue informazioni.
Come funzionano i servizi di trascrizione audio
I servizi di trascrizione audio tendono a rientrare in tre campi. Il primo è interamente guidato dal computer e utilizza modelli di intelligenza artificiale e machine learning esistenti per elaborare la conversazione. Il secondo è il più costoso perché le persone fanno il lavoro pesante. Il terzo è una combinazione di elaborazione del computer e umani.
È probabile che tu abbia più familiarità con la prima categoria. Servizi di trascrizione vocale, come quelli offerti da Google, Apple e Otter.ai —Converte le onde analogiche create dalla vostra voce in una rappresentazione digitale. Quindi li suddivide in piccoli segmenti (a volte un millesimo di secondo) e li abbina a "fonemi" noti o elementi di una lingua.
Questi algoritmi cercano quindi di esaminarli nel contesto di altri fonemi e di sottoporli a modelli statistici e di intelligenza artificiale che alla fine producono testo. Poiché questi servizi di trascrizione sono interamente gestiti dal computer, tendono ad essere i più economici da eseguire. Tuttavia, la precisione non è sempre essenziale, in particolare quando si tratta di estrarre testo da ambienti rumorosi o con più persone.
La trascrizione alimentata dall'uomo coinvolge piattaforme dedicate, come Rev , che mettono in contatto i clienti con un pool di trascrittori preapprovati. Puoi anche assumere qualcuno da un mercato freelance, come Upwork o Fiverr, trascrivere per te.
Infine, c'è il mix dei due. Per accelerare il processo di trascrizione, alcuni siti consentono all'intelligenza artificiale di fare il lavoro preliminare, quindi qualcuno riordina l'output e corregge eventuali errori.
I servizi di trascrizione si comportano male
Negli ultimi anni, molti servizi di trascrizione sono stati oggetto di violazioni e scandali.
Forse il più vecchio (e, probabilmente, il più scioccante) era SpinVox, che, negli anni 2000, offriva un servizio che trasformava i messaggi vocali in messaggi SMS. A quel tempo, questo era considerato a dir poco una svolta tecnologica. L'azienda ha rapidamente attirato stampa positiva, clienti e vasti fossati di finanziamenti.
Il problema? All'insaputa dei clienti, i loro messaggi vocali lo erano elaborati da persone che lavorano da uffici in luoghi come Pakistan, Mauritius e Sud Africa . Un addetto ai lavori dell'azienda ha affermato che solo il 2% dei messaggi vocali era elaborato da una macchina e il resto era gestito da circa 10.000 lavoratori sfruttati.
Quando i membri dello staff di un ufficio SpinVox pakistano non venivano pagati, hanno iniziato a inviare messaggi direttamente ai clienti per protestare. Alla fine, la verità è venuta fuori e SpinVox ha perso gran parte del suo valore. Alla fine, i resti dell'azienda furono venduti a Nuance , uno dei maggiori fornitori di riconoscimento vocale al mondo.
Più di recente, lo ha scoperto il giornalista di sicurezza informatica Brian Krebs una grave violazione verificatasi a MEDantex , un fornitore con sede in Kansas di servizi di trascrizione vocale per professionisti medici. Com'era prevedibile, sono trapelati dati (alcuni dei quali risalenti al 2007) contenenti cartelle cliniche sensibili. I contenuti potrebbero essere scaricati da un portale non sicuro come file di Microsoft Word.
Anche i servizi di trascrizione digitale non sono sicuri. Dopotutto, quando si utilizza un servizio interamente computerizzato, l'azienda potrebbe avvalersi di appaltatori umani per eseguire il controllo di qualità.
Nel 2019, il sito di notizie belga, VRT NWS , ha scoperto che gli appaltatori di Google stavano ascoltando le conversazioni tra le persone e i loro assistenti intelligenti di Google Home. Un appaltatore ha persino fornito a VRT NWS l'accesso alle conversazioni, molte delle quali erano di natura profondamente sensibile (e, in alcuni casi, sessualmente intime).
Anche Amazon, Apple e Microsoft utilizzavano appaltatori in questo modo. In altre parole, qualcuno potrebbe ascoltare le registrazioni vocali del tuo assistente virtuale .
RELAZIONATO: Come impedire alle aziende di ascoltare le registrazioni dell'assistente vocale
I servizi di trascrizione in linea sono sicuri?
La questione più pertinente è se i servizi di trascrizione online sono sicuri. Purtroppo la risposta è un po 'complicata.
Lo spazio di trascrizione vocale è, a questo punto, ampiamente maturo. I cattivi attori più eclatanti sono stati eliminati.
Tuttavia, quando affidi i tuoi dati (in questo caso, conversazioni private) a una terza parte, fai affidamento su di essa per proteggerli. Questo è vero tanto per i servizi online quanto per i trascrittori umani.
In definitiva, devi chiederti due cose: ti fidi del servizio e quanto sono sensibili le tue conversazioni?
Quando esplori un servizio di trascrizione, vale sempre la pena fare qualche ricerca. L'azienda ha una buona reputazione? È ben consolidato? È stato oggetto di una violazione dei dati in passato? Esiste una politica sulla privacy che specifica esplicitamente come i tuoi dati saranno gestiti e protetti?
Come accennato in precedenza, i servizi basati sull'intelligenza artificiale spesso si affidano a dipendenti e appaltatori di terze parti per eseguire controlli di qualità. Sebbene questi controlli rappresentino una frazione di tutte le trascrizioni, c'è sempre la possibilità che qualcuno ascolti la tua conversazione.
In molti casi, tuttavia, questo non è un rompicapo. Tuttavia, se la tua conversazione è profondamente privata o sensibile dal punto di vista commerciale, potresti prendere in considerazione l'apertura di un editor di testo e la trascrizione alla vecchia maniera.