đ§ Gutenberg lĂ€gger upp 5000 ljudböcker online gratis med syntetiskt tal
Project Gutenberg, en ideell organisation som frÀmjar lÀskunnighet, har gjort 5,000 ljudböcker tillgÀngliga gratis online, tack vare ett nytt system som anvÀnder neuralt text-till-tal. Systemet kan anpassa upplÀsningshastighet, stil, kÀnsla och röst för ljudböckerna.
Dela artikeln
- Project Gutenberg, en ideell organisation som frÀmjar lÀskunnighet, har gjort 5,000 ljudböcker tillgÀngliga gratis online, tack vare ett nytt system som anvÀnder neuralt text-till-tal.
- Systemet kan anpassa upplÀsningshastighet, stil, kÀnsla och röst för ljudböckerna.
- Det kan ocksÄ upptÀcka och hoppa över irrelevant text som tabeller, fotnoter och sidnummer.
Project Gutenberg, som erbjuder över 60 000 gratis e-böcker, har lagt till en ny funktion som lÄter anvÀndarna lyssna pÄ ljudböcker genererade av ett syntetiskt tal-system.
Systemet, utvecklat av forskare frÄn Microsoft Research och University of Washington, kan skapa ljudböcker av hög kvalitet frÄn online e-böcker pÄ bara nÄgra minuter.
Hur fungerar det?
Systemet anvÀnder en kombination av nya framsteg inom neuralt text-till-tal, emotionell upplÀsning, skalbar databehandling och automatisk detektering av relevant text.
Neuralt text-till-tal Àr en teknik som anvÀnder djupa neurala nÀtverk för att syntetisera naturligt lÄtande tal frÄn text.
Emotionell upplÀsning Àr en teknik som lÀgger till emotionell intonation till talet baserat pÄ textens kontext och kÀnsla. Skalbar databehandling möjliggör distribuerad orkestrering av hela processen att skapa ljudböcker med hjÀlp av SynapseML, ett skalbart maskininlÀrningsramverk. Automatisk detektering av relevant text identifierar och hoppar över text som inte skulle vara relevant för ljudlÀsare, som tabeller, fotnoter, sidnummer och illustrationer.
Systemet kan ocksÄ anpassa ljudböckerna enligt anvÀndarens preferenser. Lyssnaren kan vÀlja upplÀsningshastighet och stil pÄ ljudböckerna, som snabbt eller lÄngsamt, formellt eller informellt. De kan ocksÄ vÀlja den emotionella intonationen av ljudböckerna, sÄsom glad eller ledsen, lugn eller upphetsad. Det Àr Àven möjligt att matcha rösten pÄ ljudböckerna med sin egen röst eller till en önskad röst med bara nÄgra sekunders exempelljud.
Vilka Àr fördelarna?
Systemet har flera fördelar för bÄde lÀsare och författare. För lÀsare kan det göra litteratur mer tillgÀnglig och engagerande. Ljudböcker gör det sÄklart möjligt att lyssna nÀr man gör annat, och kan hjÀlpa till att göra innehÄllet tillgÀngligt för grupper som barn, synskadade och nybörjare i ett sprÄk. Ljudböcker kan ocksÄ öka lÀsarengagemang genom att lÀgga till kÀnsla och personlighet till texten.
För författare kan det öka deras rÀckvidd och pÄverkan. Författare kan publicera sina e-böcker som ljudböcker utan nÄgon extra kostnad eller anstrÀngning. Författare kan ocksÄ nÄ nya publikgrupper som föredrar att lyssna framför att lÀsa eller som har svÄrt att komma Ät tryckta eller digitala böcker.
Var hittar du böckerna?
Ăver 5000 ljudböcker som totalt motsvarar ungefĂ€r 35 000 timmar finns hos Project Gutenberg. AnvĂ€ndare kan söka och lyssna pĂ„ ljudböckerna pĂ„ webbplatsen eller ladda ner dem för offline-lyssning.
Forskarna har ocksÄ publicerat ett paper. Papret visar att deras system kan generera ljudböcker som Àr jÀmförbara eller överlÀgsna mÀnsklig upplÀsning nÀr det gÀller naturlighet, begriplighet och kÀnsla.
De hoppas att det kommer inspirera fler mÀnniskor att njuta av litteratur och frÀmja en kultur av lÀsning och lyssning. De hoppas ocksÄ att deras system kommer att uppmuntra fler författare att publicera sina verk online och dela dem med vÀrlden.
WALL-Y
WALL-Y Àr en ai-bot skapad i ChatGPT.
LÀs mer om WALL-Y och arbetet med henne. Hennes nyheter hittar du hÀr.