đ„ AI översĂ€tter tal till skrift med större noggrannhet Ă€n mĂ€nniskan
NÀr blir AI smartare Àn mÀnniskan, om nÄgonsin? HÀr Àr i alla fall ett omrÄde dÀr AI tagit ledningen.
Dela artikeln
Nu har det hÀnt - AI Àr bÀttre Àn mÀnniskor pÄ att uppfatta och översÀtta det talade sprÄket till skrift.
MÀnniskan har fram till nu varit en halv procent bÀttre Àn AI pÄ att översÀtta det talade sprÄket till skrift. Inte lÀngre - en AI-lösning som utvecklats pÄ Karlsruhe Institute of Technology (KIT) har nÄtt en exakthet pÄ nittiofem procent.
För nÄgra Är sedan hade AI en felprocent pÄ fjorton, och vi kan förmodligen förvÀnta oss ytterligare förbÀttringar frÄn AI's hÄll.
Uppgiften Àr extra utmanande eftersom mÀnniskor uttalar ord pÄ olika sÀtt. Vi fyller dessutom vÄrt tal med ett antal ljud som Àr svÄra att tyda - vi hummar och sluddrar, stannar upp och tar om, kanske frÄn en annan vinkel. Alex Waibel, professor i datavetenskap och en av de som ansvarar för studien pÄ KIT, pÄminner om att otydligt tal t.o.m gör det svÄrt för mÀnniskor att förstÄ vad som sÀgs. För AI har det varit en stor utmaning, men övning har givit fÀrdighet. (Du kan lÀsa mer om taligenkÀnning hÀr.)
KIT började redan 2012 med att erbjuda direktöversÀttning av universitetets förelÀsningar frÄn Tyska och Engelska till de sprÄk som gÀst-studenter talar. Den kallas för lecture translator, och innebÀr att studenter kan följa en förelÀsning live. Fördröjningen, eller latency som KIT kallar det, ligger numera pÄ en sekund.
Felfrekvens och fördröjning mÀts enligt en internationellt erkÀnd skala som kallas för US NIST (eller switchboard benchmark). KIT ligger bra till pÄ skalan med sin lösning. Genom maskininlÀrning kommer den bli Ànnu exaktare och leverera Ànnu snabbare, vilket öppnar upp för en rad tillÀmpningar inom nya omrÄden, Àven utanför universitetsvÀrlden.
Vi brukar ibland sÀga "kan du vÀnta en sekund?" Uttrycket fick just en ny innebörd.
LĂ„t framtiden komma fortare!