WER kalkulačka – výpočet Word Error Rate online
Word Error Rate (WER) je percentuálna metrika chýb slov, používaná na hodnotenie presnosti automatického rozpoznávania reči (ASR) alebo prekladových systémov. WER kalkulačka vypočíta, koľko slov bolo nesprávne rozpoznaných v porovnaní s referenčným textom.
Ako používať WER kalkulačku
Zadáme počet:
- nesprávne nahradených slov,
- vynechaných slov,
- pridaných slov,
- slov v referenčnom texte,
- klikneme na tlačidlo „Vypočítať“,
- kalkulačka vypočíta WER a interpretuje výsledok.
Vzorec na výpočet WER
WER = ((S + D + I) / N) x 100
Kde:
- S = počet substitutions (nahradené slová),
- D = počet deletions (vynechané slová),
- I = počet insertions (pridané slová),
- N = počet slov v referenčnom texte.
Príklad výpočtu WER
Referenčný text: „Ahoj svet toto je test“
Rozpoznaný text: „Ahoj svet je test“
- chýba slovo „toto“ → 1 vynechané,
- žiadne nahradené ani pridané slová,
- počet slov v referencii N=6N = 6N=6.
WER = ((0 + 1 + 0) / 6) x 100 = 16,67 %
Praktické využitie WER
- hodnotenie presnosti speech-to-text systémov,
- testovanie strojového prekladu,
- porovnanie výkonu hlasových asistentov,
- štúdium chýb v rozpoznávaní reči pre NLP výskum.
Súvisiace kalkulačky
Najčastejšie kladené otázky (FAQ)
WER 0 % znamená, že všetky slová v testovanom texte presne zodpovedajú referenčnému textu – žiadne chyby, vynechané ani pridané slová. Ide o ideálny výsledok presnosti rozpoznávania reči.
Áno, ak je počet nahradených, vynechaných a pridaných slov väčší ako počet slov v referenčnom texte. V praxi sa to stáva pri veľmi zlých alebo krátkych textoch.
WER sa používa pri hodnotení výkonu automatického prepisu reči, pri testovaní hlasových asistentov, strojového prekladu alebo v NLP experimentoch, kde je potrebné merať presnosť spracovania textu.
Zlepšenie WER zahŕňa: trénovanie modelu na väčších dátach, použitie lepšieho predspracovania textu (napr. odstránenie interpunkcie), alebo optimalizáciu jazykového modelu pre konkrétny jazyk alebo doménu.
Áno, WER môže byť citlivejší pri krátkych textoch – aj malý počet chýb výrazne zvýši percento WER. Pri dlhších textoch majú jednotlivé chyby menší vplyv na celkové percento.
Áno, WER môže slúžiť na hrubé hodnotenie prekladov, hlavne ak sa porovnáva slovo za slovom s referenčným textom. Pre sofistikovanejšie hodnotenie sa však často používa napríklad BLEU skóre, ktoré berie do úvahy aj synonymá a poradie slov.
Zdroje:
- What is WER? What Does Word Error Rate Mean?: https://www.rev.com/resources/what-is-wer-what-does-word-error-rate-mean
- Word error rate: https://en.wikipedia.org/wiki/Word_error_rate