Tag

#agenti

Všetky publikované články, v ktorých sa téma agenti objavuje ako dôležitý kontext. Aktuálne 66 textov v archíve.

Produkty19. apríla 2026

OpenAI rozširuje Codex na dlhšie workflow a prácu naprieč nástrojmi

OpenAI výrazne rozširuje Codex: z asistenta pri písaní kódu ho tlačí k agentovi, ktorý vie pracovať s počítačom, webom, obrázkami aj opakovateľnými úlohami.

Produkty19. apríla 2026

Ollama stavia na MLX a zrýchľuje lokálnu AI na Apple Silicon

Ollama v preview prepája svoj lokálny stack s frameworkom MLX a sľubuje výrazne rýchlejšie spúšťanie modelov na Apple Silicon. Pre používateľov Macov je dôležité, že lokálne agentické workflow sa tým posúvajú z hobby režimu bližšie k serióznej práci.

Výskum19. apríla 2026

AA-AgentPerf mení benchmarky AI hardvéru: testuje agentov, nie krátke prompty

Artificial Analysis spustil AA-AgentPerf, nový benchmark pre AI hardvér a inferenčné stacky. Namiesto krátkych dotazov používa reálne agentické trajektórie s dlhým kontextom, takže lepšie ukazuje, čo infraštruktúra zvládne v produkcii.

Modely19. apríla 2026

Claude Opus 4.7 posúva Anthropic vyššie v kódovaní aj agentických workflow

Anthropic uviedol Claude Opus 4.7 ako všeobecne dostupný model so silnejším softvérovým inžinierstvom, lepším videním a vyššou spoľahlivosťou pri dlhších úlohách. Dôležité nie je len skóre, ale aj posun v tom, koľko práce môžu firmy modelu reálne odovzdať bez mikromanažmentu.

Výskum16. apríla 2026

Metakognícia sama nestačí: self-monitoring moduly agentom automaticky nepomáhajú

Nová práca na kontinuálnych multi-timescale agentoch ukazuje, že pridané moduly na self-monitoring či seba-predikciu neprinášajú samy osebe merateľný zisk. Zlepšenie sa objaví až vtedy, keď sú tieto signály priamo zapojené do rozhodovacej cesty agenta.

Výskum16. apríla 2026

ArcDeck chce z paperov robiť prezentácie cez naratív, nie cez surové zhrnutie

ArcDeck je multiagentový systém, ktorý pri prevode vedeckého článku do slidov najprv rekonštruuje logiku argumentu a až potom skladá osnovu a vizuály. Signálom je, že lepší výsledok neprichádza len z väčšieho modelu, ale zo štruktúry workflow.

Výskum15. apríla 2026

Metakognícia sama nestačí: agentom pomáha až keď zasahuje do rozhodovania

Nový paper ukazuje, že samostatné moduly seba-monitorovania agentom veľmi nepomáhajú. Zisk sa objavuje až vtedy, keď sa ich výstupy napoja priamo na rozhodovaciu cestu.

Výskum15. apríla 2026

IBM a Hugging Face otvárajú VAKRA: benchmark pre agentov v API a dokumentoch

VAKRA chce merať agentov v prostredí, kde nestačí pekná ukážka ani jeden tool call. Benchmark kombinuje tisíce lokálnych API, databázy a dokumenty, aby bolo vidieť, kde sa agent láme pri viac-krokovom rozhodovaní a reálnom vykonávaní úloh.

Produkty15. apríla 2026

OpenAI posúva Agents SDK k produkcii: sandbox, pamäť a dlhšie behy

OpenAI rozširuje Agents SDK o natívne sandboxy, model-native harness a prenosnú vrstvu pre pracovný priestor. Signál je jasný: rozhodovať nebude len model, ale to, ako bezpečne a spoľahlivo vie agent pracovať so súbormi, nástrojmi a dlhšími úlohami.

Produkty15. apríla 2026

Cloudflare púšťa Registrar API pre editor, terminál aj AI agentov

Cloudflare spúšťa beta verziu Registrar API a chce dostať registráciu domén priamo do agentických workflowov. Praktický význam je väčší, než vyzerá: agenti už nemajú iba navrhovať názvy, ale vedieť ich aj okamžite overiť a kúpiť bez opustenia vývojového prostredia.

Produkty15. apríla 2026

Cloudflare tlačí agentov do praxe: Browser Run a Project Think rozširujú stack

Cloudflare rozšíril svoju ponuku pre AI agentov o Browser Run, preview platformu Project Think a Registrar API. Spoločný odkaz je zreteľný: ďalšia vlna agentov sa nebude lámať len na kvalite modelu, ale na tom, či vedia bezpečne pracovať s webom, vykonávať kód, pamätať si stav a dokončiť reálne workflow.

Modely15. apríla 2026

AWS pridáva Nemotron-3-Super-120B a Qwen3.5 do SageMaker JumpStart

Amazon SageMaker JumpStart rozšíril katalóg o modely NVIDIA Nemotron-3-Super-120B, Qwen3.5-9B a Qwen3.5-27B. Pre enterprise trh je dôležité, že AWS nepredáva len infraštruktúru, ale čoraz viac aj kurátorovaný výber modelov pre konkrétne úlohy.