Transskription sammenlignet
Hvor præcis er scryp ved dansk transskription – og hvor sikre er dine data sammenlignet med de store cloud-tjenester? Her er resultaterne af vores benchmark.
Transskriptionsnøjagtighed for dansk
Word Error Rate (WER) – lavere er bedre. Nøjagtighed = 100 % − WER.
← Scroll tabellen til siden →
| Udbyder | Generelt (nøjagtighed) | Fagdomæne (nøjagtighed) | WER generelt |
|---|---|---|---|
| scrypSX-3 | 97.2 % | 96.1 % | 2.8 % |
| OpenAIWhisper Large v3 | 91.8 % | 83.5 % | 8.2 % |
| Google STTCloud Speech-to-Text | 88.5 % | 80.2 % | 11.5 % |
| Azure SpeechMicrosoft Cognitive | 87.9 % | 78.7 % | 12.1 % |
| AWS TranscribeAmazon Standard | 85.7 % | 75.9 % | 14.3 % |
Testdatasæt & metode
- Grundlaget er vores eget testdatasæt af offentligt tilgængelige danske lydoptagelser i domænerne Generelt, Sundhed og Jura.
- Alle udbydere blev testet med identiske lydfiler og ensartet evalueringsmetode (Word Error Rate efter standardnormalisering).
- Kolonnen Fagdomæne viser gennemsnittet for sundheds- og juraoptagelser. Ved fagsprog stiger fejlraten hos alle udbydere – men markant mere hos modeller uden domænespecifik træning.
- Resultater kan variere afhængigt af lydkvalitet, antal talere, dialekt og konkret anvendelse.
Hvorfor scryp er bygget anderledes til følsomt indhold
Disse punkter beskriver scryps egen arkitektur. De er bevidst præcise og ikke ment som en generel udtalelse om alle andre udbydere.
Kryptering på din enhed
Filer krypteres i browseren før upload. Gemt indhold opbevares permanent kun krypteret.
Klar EU-arkitektur
Transskription i Østrig, krypteret lagring i Tyskland – begge i EU. Det gør det gennemskueligt, hvor hvert behandlingstrin sker.
Egen behandlingsinfrastruktur
Transskriptionen bruger ingen eksterne AI-tredjeparter. Det reducerer ekstra datastrømme og afhængigheder.
Produktivt browser-workflow
Redigering, eksport, deling og lydsync er indbygget direkte i produktet, ikke kun som separate API-byggeklodser.
Kilder & dokumentation
Udbyderfunktioner blev verificeret mod officiel dokumentation. Nøjagtighedstal bygger på testdatasættet beskrevet ovenfor.
Modeller & nøjagtighed
- Radford et al. (2022): Robust Speech Recognition via Large-Scale Weak Supervision - OpenAI Whisper Paper
- OpenAI Whisper Repository - Modelle und Sprachen
- faster-whisper (SYSTRAN) - CTranslate2-basierte Whisper-Implementierung
- pyannote.audio 3.x - Speaker Diarization Pipeline
- Mozilla Common Voice - Offener Sprachdatensatz
Udbyderdokumentation
- Google Cloud Speech-to-Text - Funktionsübersicht und Spracherkennung
- Google Cloud Speech-to-Text - Speaker Diarization
- Microsoft Azure Speech Service - Übersicht und Dokumentation
- Azure Speech - Real-time diarization quickstart
- Amazon Transcribe - Entwicklerhandbuch
- Amazon Transcribe - Speaker partitioning (Diarization)
Klar til sikker transskription?
Prøv scryp gratis – krypteret fra første sekund.