AgentOdyssey testuje, či sa agenti vedia učiť počas dlhých textových hier
Nový preprint navrhuje benchmark, v ktorom agenti počas testovania skúmajú procedurálne generované textové svety, ukladajú skúsenosti a plánujú dlhé úlohy.
Tag
Všetky publikované články, v ktorých sa téma agentické AI objavuje ako dôležitý kontext. Aktuálne 4 textov v archíve.
Nový preprint navrhuje benchmark, v ktorom agenti počas testovania skúmajú procedurálne generované textové svety, ukladajú skúsenosti a plánujú dlhé úlohy.
Preprint o AgenticRei tvrdí, že podnikové AI agenty nemožno riadiť iba pravidlami povoliť alebo zakázať. Navrhuje runtime politiku s povinnosťami, výnimkami a riešením konfliktov mimo samotného jazykového modelu.
Hugging Face publikoval technický field report z hackathonu, v ktorom päť agentov nad 3B modelom Qwen2.5 obchoduje v malej simulačnej ekonomike. Zaujímavý nie je marketingový efekt, ale praktické ponaučenia: malé modely sú lacné na veľa opakovaných rozhodnutí, no potrebujú prísne obmedzenia, opravy výstupu a dobre navrhnuté prostredie.
NVIDIA Nemotron 3 Ultra je od 4. júna dostupný v Amazon SageMaker JumpStart. AWS ho rámuje ako otvorený model pre dlhé agentické workflowy, kde rozhoduje nielen presnosť, ale aj čas dokončenia úlohy a cena za beh.