Kunstig intelligens gjør endelig det vi håpet på

Vi er journalister, vi liker å møte og intervjue mennesker. Verst av alt er transkripsjonen av over en time med tale-til-tekst-opptak. Det er veldig tidkrevende og nesten alle i bransjen ville elske å bli kvitt denne prosessen. I løpet av de siste årene har jeg mottatt forskjellige e-poster om tsjekkiske verktøy som utfører transkripsjoner – nærmere bestemt var det ni av dem på seks år, men ingen av dem viste seg å være brukbare i testing . Nå ser det imidlertid ut til at den teknologiske utviklingen endelig har nådd ønsket tilstand. En løsning som du allerede kan jobbe med, tilbys av Beey-applikasjonen fra verkstedet til det nasjonale selskapet Newton Technologies, der forskere fra det tekniske universitetet i Liberec også samarbeidet.

Ikke at all programvaren jeg har testet gjennom årene er helt dårlig, den gjør nok jobben bra for spesifikke brukstilfeller. Men jeg er en helt vanlig journalist som skriver, intervjuene mine lages ikke i profesjonelle studioer med høy lydkvalitet. I stedet går jeg ofte på bråkete kafeer eller restauranter og tar dem opp på mobilen, noe som reduserer lydkvaliteten betraktelig.

Så da en pressemelding om enda et tsjekkisk taletranskripsjonsverktøy dukket opp i e-posten min, var jeg skeptisk etter mange opplevelser. I løpet av det siste året har det imidlertid blitt gjort betydelige fremskritt i utviklingen av kunstig intelligens, som spesielt har blitt populær blant allmennheten av OpenAIs ChatGPT-verktøy. Og det er derfor jeg var nysgjerrig på å vite om forbedringen av NLP-teknologier visstnok går hånd i hånd med denne fremgangen naturlig språkbehandling, det vil si naturlig språkbehandling. Med måten kunstig intelligens for øyeblikket kan håndtere tekstoppretting, kan man også se fremgang i å lage transkripsjoner.

Med skaperne Beey-appen Jeg sa ja til å få tilgang til testversjonen. Og jeg må innrømme at jeg ble positivt overrasket over resultatet. Etter mange år, endelig det første brukbare verktøyet selv for behovene til en vanlig journalist. Den transkriberer raskt opptaket til tekst, forstår slutten av setningen, gjenkjenner generelt stemmene til individuelle høyttalere, og letter tekstredigering. Selve verktøyet fungerer ganske enkelt, brukeren laster opp et lydopptak av de mest brukte formatene og programvaren transkriberer. Den konverterer et timelangt opptak til skriftlig form på minutter i gjennomsnitt.

test-transcript-beey

Foto: CzechCrunch

Transkripsjon av testopptaket i Beey-appen

En teksteditor er også tilgjengelig, der det er mulig å jobbe med lyd og tekst samtidig, noe som forenkler de siste justeringene. Men Beey tilbyr også andre brukstilfeller, inkludert å lage undertekster for videoer, oversettelser og mer. I den grunnleggende prismodellen belastes programvaren med tre kroner pluss moms per opptaksminutt. Den tilbyr tilpassede priser gjennom firmaprofiler med mer avanserte funksjoner.

«Grunnlaget for Beey er taletranskripsjon som er rask og så nøyaktig som mulig. Den er nesten 100 % feilfri i mange opptak. I fjor, takket være nye nevrale modeller, økte vi også nøyaktigheten selv for opptak av lavere kvalitet, for eksempel pressekonferanser eller støyende omgivelser.» forklarer Petr Červa, leder for et team av forskere ved det tekniske universitetet i Liberec, hvor de jobber med datamodeller for talegjenkjenning og også var involvert i etableringen av Beey.

I motsetning til Beey, transkriberer de fleste konkurrerende verktøyene jeg har testet de siste årene tekst uten tegnsetting. Transkripsjonen av det én times lange opptaket inneholder derfor «en setning» på flere tusen ord. Noen verktøy hjelper ved å konvertere opptaket til undertekststilen, for eksempel etter femten sekunder. Derimot kan Beey vanligvis skille individuelle høyttalere, så resultatet ligner mest på en typisk samtale.

Tilfeldigvis kom vi samtidig i skrift også over konkurrerende programvare Good Tape fra Nederland, som tilbyr lignende funksjonalitet. Men den tsjekkiske appen fungerer på et høyere nivå, som et eksempelutskrift av en rask testsamtale med en kollega også viser (se skjermbilder over og under). Vi har også brukt forkortelser og engelske ord med vilje, som gir relevant innsikt i hvordan AI-språkmodellen er satt opp.

test-transkripsjon-goodtape

Foto: CzechCrunch

Transkribere et testopptak i Good Tape-appen

Selve teksten må imidlertid fortsatt jobbes med, redigeringsgraden påvirkes alltid av respondenten selv – noen bruker utfyllingsord og ulike forkortelser og anglisismer blandes i talespråket. Beey kan takle noen, men ikke alltid. Men det fungerer pålitelig i stor grad, noe som sparer mye tid ved transkribering av lange samtaler. Selv i redigering er det bedre å jobbe med teksten enn med opptaket, noe som også ble satt pris på av andre redaksjonskolleger. Og ikke bare oss – verktøyet er også nyttig for studenter, podcast- og videoskapere, forskere og generelt alle som jobber med lydopptak.

I tillegg til tsjekkisk kan Beey for tiden jobbe med nitten andre verdensspråk, inkludert engelsk og tysk, men kan også snakke norsk eller svensk. Den tsjekkiske applikasjonen brukes nå av mer enn ti tusen brukere i femti land rundt om i verden. «Vårt mål er at resultatene av den nyeste forskningen innen kunstig intelligens kan brukes av alle, enten det er en journalist, en student, en lege eller til og med en embetsmann. Derfor kan alle prøve programmet vårt gratis», forklarer Petr Herian, direktør i selskapet Newton Technologiessom samarbeider med et team av forskere fra det tekniske universitetet i Liberec om utviklingen av Beey.

Ifølge Herian bidrar den nåværende økte interessen for innovasjoner innen kunstig intelligens til å forbedre disse teknologiene ytterligere og forske på deres videre anvendelse. «Folk blir sakte vant til at stemmeteknologi har blitt en del av deres arbeid og hverdag. Og det er mer enn bare å diktere meldinger til en mobiltelefon. Programmet vårt tekster populære serier, hjelper døve eller transkriberer rettferdighetshandlinger. Det letter arbeidet til journalister eller undervisning i skolen. Det er mange nye muligheter”, legger Herian til.

Liv Malthe

Student. Subtilt sjarmerende bacon-junkie. Spiller. TV-utøver. Frilansmusikkekspert

Legg att eit svar

Epostadressa di blir ikkje synleg. Påkravde felt er merka *