Secondo il team di ricercatori dell’azienda, lo strumento VALL-E 2 è ora in grado di riprodurre le voci delle persone in modo abbastanza convincente e ha raggiunto la “parità umana”.
Nel 2023, Microsoft sviluppo la Valleun sistema di intelligenza artificiale in grado di imitare qualsiasi voce umana entro soli 3 secondi dalla registrazione, e di captare anche il tono emotivo di chi parla.
L’azienda non è rimasta soddisfatta di questo grande progresso, quindi ha deciso di svilupparsiS Val-E2È un modello migliorato che raggiunge la “parità umana”. Per eseguirlo, usi questo strumento LibriSpeech E VCTK Per mappare il testo sull’audio, imitando pronuncia, intonazione e ritmo. Dopo aver ascoltato un breve clip e ricevuto l’input di testo, Val-E2 Produce un suono sintetico identico all’originale.
Nonostante il suo straordinario potenziale, Microsoft È considerato Val-E2 Un progetto di ricerca, che non prevede di essere reso pubblico a causa dei rischi di phishing. Il team suggerisce che potrebbe essere utile nell’istruzione e nell’intrattenimento, ma riconosce questioni etiche e lavorative, come l’imitazione senza consenso e la sostituzione dei doppiatori.
Microsoft mette in guardia contro gli abusi Val-E2, mentre altri sistemi di intelligenza artificiale per la riproduzione vocale, sebbene meno accurati, sono già utilizzati dai criminali informatici. In Spagna una donna è stata truffata con la chiamata vocale clonata del marito. È fondamentale che le persone siano informate di questi sviluppi per prevenire crimini e frodi.
“Educatore generale della birra. Pioniere del caffè per tutta la vita. Sostenitore certificato di Twitter. Fanatico di Internet. Professionista dei viaggi.”