Allt du behöver veta

Tal till text, automatisk transkription, automatiska undertexter, automatisk taligenkänning (ASR), datortaligenkänning och röst till text är alla inom samma område av AI-teknik som sätter talade ord i skriftlig text!

Vad är tal till text?

Tal till text är ett automatiskt taligenkänningssystem (ASR) som huvudsakligen består av statistiska modeller som kartlägger kontinuerliga talade yttranden eller talvågformer till text på mänskligt språk. ASR-systemet är sammansatt från en språkmodell, en uttalsmodell (lexikon/ordbok) och en akustisk modell. När ASR-systemet konsekvent matas och tränas med nya taldata av flera talare får det ett utökat ordförråd, och noggrannheten i ASR-transkriptet ökar. Därför, ju mer ASR har använt desto bättre noggrannhet får den. Noggrannhetsnivåerna mäts och ställs in av Felfrekvens för ord (WER).

För att en ASR-modell ska anses vara mycket exakt måste WER-korrespondensen vara mindre än 10%. Txtplays ASR-modell anses vara mycket exakt och det beror på att vi levererar en noggrannhet på 94%.

Varför behöver vi det?

  • Språkbarriärer: Undertexter tillåter människor att förstå språk som inte är deras modersmål/de inte talar genom att översätta ord eller meningar till användarens föredragna språk.
  • Förbättrad koncentration: hjälp för personer med läs- eller inlärningssvårigheter. Personer med läs- eller inlärningssvårigheter kan dra nytta av undertexter för att förstå innehållet bättre och snabbare.
  • Bullriga miljöer: I bullriga miljöer, till exempel på offentliga platser, flygplan eller tåg, gör undertexter det möjligt att följa med i dialogen.
  • Undertexter: är en utmärkt resurs för språkinlärning.
  • Undvik att störa andra; de flesta tittar på videor på tyst medan de är offentliga.
  • Citat och referenser: För forskare, författare och journalister kan undertexter vara en värdefull källa till citat och referenser när man skriver om film eller medieinnehåll.
  • Transkription av långa intervjuer: 1 timmes ljudinnehåll tar cirka 6 timmar att transkribera manuellt,

Tal-till-text och automatisk taligenkänning (ASR) gör att ljudinnehåll kan vara visuellt tillgängligt för alla genom att lägga till text. Att lägga till tal-till-text och undertexter ger tillgänglighet för hörselskadade målgrupper som annars skulle uteslutas från detta innehåll. Därför har automatisk taligenkänning (ASR) blivit en nödvändighet att ha för att göra innehåll tillgängligt för alla.

Att göra videoinnehåll på nätet tillgängligt för alla har blivit ett nytt EU-direktiv som fastställts av Riktlinjer för det europeiska handikappforumet och Riktlinjer för tillgänglighet för webbinnehåll (WCAG).

EU-direktivets datum och lagstiftning:

  • 23 september 2019: Tillgänglighetskrav gäller för alla offentliga webbplatser som lanseras efter detta datum.
  • 23 september 2020: Lagen kommer också att tillämpas baklänges - det vill säga den kommer att gälla alla offentliga webbplatser.
  • 23 juni 2021: Lagstiftningen gäller även mobilapplikationer.

Hur fungerar tal till text med taligenkänning?

Med automatisk taligenkänning (ASR) känner en algoritm igen orden som talas i din video och levererar maskinbaserade texter för indexering, textning och sökning. Resultatet är bra och användbart, men inte alltid perfekt. Resultatet som levereras beror mycket på ljudkvaliteten hos källmaterialet som används.

Om det finns mycket ljud, och om många människor pratar i varandras munnar, blir resultatet inte perfekt. Undertexterna behöver därför ofta omarbetas, men det tidskrävande arbetet har gjorts - särskilt när det gäller tidpunkten för undertexterna. Txtplay kan tillhandahålla efterbehandling av undertexterna på timbasis.



Sök efter ett ord eller klicka på texten för att navigera. Undertexterna i detta exempel är inte efterbehandlade och tillhandahålls direkt från vår tal-till-text-algoritm.

__wf_reserverad_ärva

Komma igång!

Steg 1: Skapa ditt txtplay-konto
Tryck på valfri ”Kom igång” -knappar på vår webbplats och bli direkt överförd till vår ”skapa konto” -sida. Över på sidan ”skapa konto” anger du ditt namn, e-postadress och valt lösenord. När du har skapat ditt konto skickar vi en aktiveringslänk till din e-postadress, om du inte får ett aktiveringsmail kontrollera din skräp- eller skräppostmapp. Annars kan du maila vår support på contact@imgplay.com.

Steg 2: Välj betalningsmetod
Txtplay accepterar nästan alla betalningsmetoder som American Express, Visa och Mastercard.

Steg 3: Välj en av våra prissättningsmoduler
Välj mellan Pay as you go, Pro och Enterprise.

Betala som du går: €0.25/MIN transkriberad media, perfekt för snabb åtkomst till transkript och undertexter!

Proffs: För proffs som möter transkriptionsbehov dagligen. Få större rabatter ju mer inkluderad transkription. Kontakta vår försäljningschef för mer information!

Företag: Höga volymtranskriptionsrabatter med avancerade funktionsinställningar byggda för team. Kontakta vår säljare för ett tillfredsställande samarbete!

Steg 4: Ladda upp din ljud- eller videofil
Ladda upp dina media och välj ditt språk. Vår taligenkänningsmotor tar hand om jobbet och meddelar dig när det är klart. Du kan fortsätta arbeta medan vår AI gör magin.

Steg 5: Redigera din ljud- eller videofil
Vi ansluter dina media till transkriptet i vår textredigerare online där du kan uppdatera, markera, upptäcka högtalare och söka igenom din text, och bläddra i ditt ljud eller video.

Steg 6: Exportera till över 20 format
Vi stöder över 20 format inklusive: SRT, VTT, .docx. Du kan finjustera exporten med detaljer som Timecode, Atlasformat, högtalare etc. Vi har också utvecklarvänliga alternativ.

Gratis kontra betalt tal till text

Det finns gratis tal-till-text-versioner som du kan hitta online, men det finns vissa skillnader mellan gratis och betalda versioner som vi tycker är viktiga att tänka på. För det första är kvaliteten på de transkript som den fria ASR genererar, de kommer ofta med låg noggrannhet. På txtplay strävar vi alltid efter att öka vår noggrannhet, så att vi kan leverera högkvalitativa transkript till våra kunder. För det andra kommer gratis tjänster med ett pris, och det är dina data, de behåller dina data för sitt eget intresse. På txtplay tror vi på integritet och säkerhet, det är därför vi alltid raderar alla våra kunders uppgifter direkt efter att din process är klar. För det tredje stöder gratistjänster ibland inte det filformat du behöver. På txtplay stöder vi transkriptexport till över 20 format som gör det möjligt för våra kunder att till exempel ladda ner transkriptet som en Word-fil för att inkludera det i en intervju eller en srt-fil för att lägga till undertexter för en video.

Andra tjänster för yttrandefrihet till text

  • Låg noggrannhet
  • Begränsad bearbetning
  • Ingen kundsupport
  • Inga tydliga riktlinjer för datalagring
  • Ingen online-plattformsredigerare
  • Begränsade filexportmöjligheter

Txtplays betalda tal till texttjänster

  • Hög noggrannhet
  • Obegränsad bearbetning
  • Kundsupport
  • Tydliga riktlinjer för datalagring
  • Online plattformsredigerare
  • Nästan obegränsade möjligheter för olika filexportalternativ