Tag

#NLP

Všetky publikované články, v ktorých sa téma NLP objavuje ako dôležitý kontext. Aktuálne 5 textov v archíve.

Výskum23. júna 2026

Apple ukazuje, že počet anotátorov má závisieť od metriky

Výskum Apple Machine Learning skúma učenie z rozdelení ľudských štítkov. Ukazuje, že niektoré metriky sa nasýtia pri desiatich anotátoroch, iné potrebujú dvadsať až päťdesiat.

Výskum12. júna 2026

AfriSUD pridáva syntaktické treebanky pre deväť afrických jazykov

Nový arXiv preprint predstavuje AfriSUD, kolekciu syntakticky anotovaných dát pre deväť afrických jazykov. Práca je dôležitá pre hodnotenie NLP modelov mimo jazykov, ktoré dominujú dnešným benchmarkom.

Výskum25. mája 2026

Nový prehľad mapuje NLP zdroje pre hausštinu a fongbe

Preprint katalogizuje textové a rečové dáta, modely a benchmarky pre dve západoafrické jazyky. Ukazuje, že aj pri desiatkach miliónov hovoriacich zostáva praktická infraštruktúra pre NLP nerovnomerná a krehká.

Výskum25. mája 2026

Pipeline pre katharevousu ukazuje, ako z historického OCR vytvoriť auditovateľné NLP dáta

Výskumníci pripravili reprodukovateľný Universal Dependencies štýl pipeline pre grécke parlamentné texty v katharevouse. Spája OCR rekonštrukciu, LLM asistovanú anotáciu, validáciu a pevné benchmarky.

Výskum15. apríla 2026

LLM stále zlyhávajú pri abstraktných pojmoch viac, než sa čakalo

Nový paper pripomína, že veľké jazykové modely nemusia mať pevné chápanie abstraktných významov. Na úlohe ReCAM zaostávajú aj za staršími fine-tuned modelmi.