Hem yttranden Ai är (också) en kraft för gott | ben dickson

Ai är (också) en kraft för gott | ben dickson

Innehållsförteckning:

Video: Bibliotekets roll i spänningen mellan källkritik och källtillit (September 2024)

Video: Bibliotekets roll i spänningen mellan källkritik och källtillit (September 2024)
Anonim

Under 2017 rånade Amyotrophic Lateral Sclerosis (ALS), en förödande neurologisk störning, Pat Quinn, grundaren av den berömda Ice Bucket Challenge, för sin förmåga att tala.

År 2018 hjälpte konstgjord intelligens honom att få tillbaka den.

Tack vare framstegen inom maskininlärning och djupinlärning har algoritmer för konstgjord intelligens blivit mycket bra på att imitera människor. Men medan många framträdande utvecklingar i rymden har varit negativa, var AI: s imiteringskraft en kraft av positiv förändring för Quinn.

"De flesta människor som lever med ALS (även känd som motorneuronsjukdom) hamnar förlamade och kan inte kommunicera med annat än konstgjorda" dator "-röster, " säger Oskar Westerdal, grundare av Project Revoice, ett initiativ som syftar till att hjälpa ALS-patienter som Quinn.

För att återskapa Quinns röst, samarbetade Project Revoice med Lyrebird, ett av en handfull företag som använder AI för att klona en persons röst - en grupp som också inkluderar Googles WaveNet och Voicery, en Y Combinator-backstart som använder AI för att skapa syntetiserade röstinspelningar.

Hur Deep Learning genererar mänskliga röster

Bakom dessa applikationer finns djupinlärningsalgoritmer, en populär gren av AI som granskar stora uppsättningar data för insikter och mönster som inte kan fångas med traditionell, regelbaserad programvara. När du tränar en djupinlärande röstsynthesizer med tillräckligt med röstinspelningar skapar det en digital modell som representerar personens röst och kan generera nya röstprover.

Före tillkomsten av AI-driven röstsyntes-teknik var ALS-patienter tvungna att använda generiska digitala röster som inte var deras egna. Annan teknik kunde sy samman förinspelade meningar med patientens röst, men resultaten var för konstgjorda och krävde dussintals timmar med röstinspelningar för att vara till minimal användning.

Djupt lärande applikationer kräver å andra sidan mycket mindre data och ger bättre resultat. "Vad Lyrebird kan uppnå med bara ett par timmar ljud är anmärkningsvärt - det ger människor en komplett digital röstklon, så att de kan säga vad de vill, " säger Westerdal.

Återskapa en röstlös person

En av gränserna för applikationer med djup inlärning är deras beroende av högkvalitativa dataprover för att träna sina neurala nätverk. Problemet med ALS-patienter är att när de förlorar sina röster är det omöjligt att spela in röstprover. Lyckligtvis hade Quinn timmar med inspelade keynoter och intervjuer.

"Den största utmaningen var kvalitet. Den här tekniken är helt beroende av att ha konsekventa inspelningar av hög kvalitet som också följer ett exakt manus - så vi var tvungna att arbeta med en ljudstudio för att manuellt" remastera "och transkribera varje dialogruta vi kunde hitta av Pat, "säger Westerdal.

"Vi var lite rädda för att vi inte skulle kunna ge en bra kvalitet för att skapa Pats röst, " säger Jose Sotelo, medstifter av Lyrebird. "Eftersom vi inte kunde få rena inspelningar är den slutliga kvaliteten på den konstgjorda rösten inte perfekt. Vi tror att vi kan göra ett mycket bättre jobb med rena inspelningar."

Resultaten låter fortfarande lite onaturliga och syntetiska. Men för Quinn, som hade använt en generisk röst för att kommunicera, var skillnaden dramatisk. "Efter att ha hört min röst genom denna nya teknik blåsades jag bort! För att patienter ska veta att de kan ha sin egen röst efter att ALS tar bort den kommer det att förändra hur människor lever med ALS, " säger han.

Quinn rekommenderar att ALS-patienter spelar in sina röster innan det är för sent. "Efter att ha hört min egen röst igen, behöver jag ALS-patienter att veta att inspelningen av deras röst är oerhört viktigt, " säger han.

Balansera de negativa användningarna av AI-synthesizers

Tidigare i år utlöste FakeApp, en AI-driven ansiktsbyteapplikation, ett angrepp av falska pornografiska videor med kändisar och politiker. Det finns oro för att applikationer som FakeApp och Lyrebird kommer att inleda en ny tid av falska nyheter, bedrägerier och förfalskning.

Etik-sidan på Lyrebirds webbplats erkände tidigare att tekniken kan "potentiellt få farliga konsekvenser som vilseledande diplomater, bedrägeri och mer allmänt alla andra problem orsakade av att stjäla någon annans identitet."

För att driva poängen har företagets webbplats flera syntetiserade inspelningar skapade med rösterna från Donald Trump och Barack Obama.

@realDonaldTrump https://t.co/N6DRPdEGPT pic.twitter.com/G30DvmQNdk

- Lyrebird AI (@LyrebirdAi) 4 september 2017

Quinns berättelse kan hjälpa till att belysa de positiva aspekterna av en bransch som har tagit flak för den potentiellt läskiga och oetiska användningen av dess applikationer. "Det är viktigt att människor inser den ljusa sidan av denna teknik, " påminner Lyrebird's Sotelo.

Bortsett från medicinskt bruk kan AI-synthesizer-applikationer tjäna andra produktiva mål. Voicery förser varumärken med anpassade digitaliserade röster som drivs av AI-algoritmer. Google experimenterar också med WaveNet för att ge en mer naturlig upplevelse för användarna av sina Google Assistant-driven enheter. Andra områden där tekniken är användbar är att automatisera ljudböcker eller göra röstdubbning i filmer mycket enklare.

Etiska och juridiska hinder kommer utan tvekan att uppstå och debatter kommer att fortsätta. Men för Quinn är AI en kraft för gott. "Jag vill inte låta som en dator", säger han. "Jag vill låta som jag."

Ai är (också) en kraft för gott | ben dickson