Anthropic kupuje Stainless a posilňuje SDK aj MCP vrstvu pre agentov
Anthropic získava firmu Stainless, ktorá mu od začiatku pomáhala so SDK. Teraz chce túto vrstvu využiť aj na širšie napájanie agentov na nástroje a API.
Tag
Všetky publikované články, v ktorých sa téma AI agenti objavuje ako dôležitý kontext. Aktuálne 72 textov v archíve.
Anthropic získava firmu Stainless, ktorá mu od začiatku pomáhala so SDK. Teraz chce túto vrstvu využiť aj na širšie napájanie agentov na nástroje a API.
Čerstvý preprint na arXive navrhuje dvojrozmerný rámec pre návrh AI agentov, ktorý prepája to, čo agent robí, s tým, ako je jeho workflow architektonicky poskladané.
Framework Mastra pridáva response caching pre agentov. Identické požiadavky vie počas nastavenej TTL obslúžiť z cache bez nového volania modelu, čo má znížiť náklady aj latenciu.
Mastra pridáva integráciu s Temporalom, vďaka ktorej majú workflowy získať trvácny stav, retry mechanizmy a plánovanie dlhých behov. Pre agentické stacky je to dôležitý posun od demo orchestrace k infra, ktorá prežije reštarty aj viacdňové úlohy.
OpenAI po ôsmich týždňoch zhrnulo súťaž Parameter Golf a ukazuje, že malé, prísne obmedzené benchmarky už neslúžia len na zábavu. Stávajú sa lakmusovým papierikom pre kvalitu experimentovania, kompresie modelov aj práce AI kódovacích agentov.
Mastra rozširuje agentický framework o background tasks, takže dlhé volania nástrojov môžu bežať na pozadí, priebežne posielať stav a po dokončení sa znovu zapojiť do tej istej konverzácie.
Výskumníci z Karlsruhe Institute of Technology, Helmholtz Institute Ulm a TU Munich opisujú workflow, v ktorom AI agent riadi výber ďalších experimentov pri vývoji sodíkovo-iónových článkov. Cieľom je skrátiť testovanie a zároveň nestratiť kvalitu výsledku.
Nový paper na arXive navrhuje, aby sa ľudský dohľad nad AI agentmi nestaval ad hoc do každej aplikácie, ale aby fungoval ako samostatná vrstva systému. Prístup môže byť dôležitý pre bezpečnejšie nasadenie agentov vo firmách aj vo verejnej správe.
OpenAI zverejnila Symphony ako otvorenú špecifikáciu a referenčný projekt pre koordináciu kódujúcich agentov nad task trackerom. Nejde len o ďalší chatovací nástroj, ale o pokus premeniť issue board na riadiacu rovinu pre nepretržitú agentickú prácu.
Anthropic v experimente Project Deal nechal agentov Claude vyjednávať reálne obchody medzi zamestnancami. Výsledok ukazuje, že agenti už vedia uzatvárať dohody bez človeka v slučke a že kvalita modelu sa môže priamo premeniť na lepšie obchodné výsledky.
Nový benchmark AgentSearchBench tvrdí, že pri AI agentoch nestačí opis v katalógu. Rozhodovať má aj správanie pri vykonaní úlohy a schopnosť zvládnuť úlohy z otvoreného prostredia.
Google Cloud spája Vertex AI, správu agentov a nové podnikové funkcie do Gemini Enterprise Agent Platform, ktorá má firmám uľahčiť vývoj, nasadenie aj dohľad nad dlhobežnými AI agentmi.