ServiceNow testuje, ako hlasoví agenti zvládajú prepínanie jazykov
Benchmark na Hugging Face ukazuje, že rozpoznávanie reči v dvojjazyčných kontaktných centrách zostáva pre hlasových agentov slabým miestom.
Tag
Všetky publikované články, v ktorých sa téma ASR objavuje ako dôležitý kontext. Aktuálne 4 textov v archíve.
Benchmark na Hugging Face ukazuje, že rozpoznávanie reči v dvojjazyčných kontaktných centrách zostáva pre hlasových agentov slabým miestom.
Hugging Face mení pravidlá svojho Open ASR Leaderboardu. Nové kvalitné, ale neverejné testovacie datasety majú obmedziť takzvané benchmaxxing a lepšie odlíšiť modely, ktoré zvládajú reálnu konverzačnú reč, prízvuky a menej sterilné podmienky.
Amazon zverejnil architektúru, ktorá spája open-source model Parakeet-TDT, AWS Batch a spotové GPU inštancie pri veľkoobjemovom prepise audia. Signálom nie je len technický návod, ale aj rastúci tlak na lacnejšie multimodálne pipeline mimo uzavretých API služieb.
Cohere uviedlo Transcribe ako open-source ASR model pre presnejšie prepisy zvuku. Nie je to len ďalší hlasový model: firma tým naznačuje, že speech intelligence sa stáva samostatnou vrstvou enterprise AI, naviazanou na analytiku, vyhľadávanie a automatizáciu.