Cloudflare opisuje Skipper: interného AI agenta nad jednotnou dátovou platformou
Cloudflare ukázal, ako vybudoval Town Lake ako jednotné SQL rozhranie k dátam a Skippera ako AI agenta, ktorý nad ním odpovedá auditovateľným spôsobom.
Tag
Všetky publikované články, v ktorých sa téma AI agenti objavuje ako dôležitý kontext. Aktuálne 72 textov v archíve.
Cloudflare ukázal, ako vybudoval Town Lake ako jednotné SQL rozhranie k dátam a Skippera ako AI agenta, ktorý nad ním odpovedá auditovateľným spôsobom.
xAI otvorilo model grok-build-0.1 v API. Cieli na agentické kódovanie, debugovanie a prácu s MCP, pričom má bežať rýchlosťou nad 100 tokenov za sekundu.
Amazon Bedrock AgentCore pridáva workflow pre správu evaluačných datasetov, aby agenti mali stabilné regresné testy aj pri rýchlom vývoji v produkcii.
Snowflake sprístupňuje Claude Opus 4.8 v Cortex AI ako verejný preview model. Pre firmy je dôležité najmä to, že nový model môžu skúšať pri kóde, analytike a agentických workflow bez presúvania dát mimo riadeného prostredia Snowflake.
Nový arXiv preprint opisuje agenta, ktorý kombinuje rýchly router a pomalší LLM meta-kontrolér pre meniace sa edge prostredie. V simuláciách znižuje latenciu oproti statickým stratégiám o 65 až 73 percent.
Artificial Analysis a IBM spúšťajú benchmark ITBench-AA pre agentické úlohy v podnikovej IT prevádzke. Prvé výsledky sú triezve: najlepšie frontier modely zostávajú pod hranicou 50 percent.
Nový technický článok AWS opisuje architektúru, v ktorej špecializovaní agenti nad Bedrock AgentCore priraďujú rádiologické prípady podľa komplexnosti, špecializácie lekára a aktuálnej záťaže, nie iba podľa pevných pravidiel.
Stabilná vetva PydanticAI dostala novú frontu pending správ, podporu MCP background tasks a viacero opráv okolo modelov Anthropic, Bedrock a nástrojových argumentov.
Nový preprint opisuje systém AgentNLQ, ktorý pri úlohách NL2SQL kombinuje obohatenú schému, biznis pravidlá a viac agentov. Na benchmarku BIRD hlási 78,1 % sémantickú presnosť.
Amazon rozširuje Bedrock AgentCore o vlastné kódové evaluátory. Firmy tak môžu popri hodnotení cez LLM zaviesť aj deterministické kontroly JSON schém, číselnej presnosti, poradia krokov či únikov PII.
Nový Open Agent Leaderboard nechce merať iba model, ale celý agentický systém vrátane nástrojov, plánovania, pamäte a ceny prevádzky.
OpenAI a Dell chcú dostať Codex bližšie k podnikovým dátam, dokumentácii a systémom bez toho, aby firmy museli všetko presúvať do jedného cloudu.