Hugging Face a NVIDIA zrýchľujú dolaďovanie MoE modelov cez NeMo AutoModel
Nový technický článok ukazuje, ako NeMo AutoModel využíva Transformers v5 na rýchlejšie a úspornejšie dolaďovanie zmesí expertov bez prepisovania tréningového kódu.
Tag
Všetky publikované články, v ktorých sa téma open-source objavuje ako dôležitý kontext. Aktuálne 31 textov v archíve.
Nový technický článok ukazuje, ako NeMo AutoModel využíva Transformers v5 na rýchlejšie a úspornejšie dolaďovanie zmesí expertov bez prepisovania tréningového kódu.
OpenAI predstavuje rozšírenie Daybreak, Codex Security, GPT-5.5-Cyber a iniciatívu Patch the Planet. Dôraz sa presúva z objavovania zraniteľností na validáciu, opravy a spoluprácu s udržiavateľmi.
IBM Research publikoval na Hugging Face príklady agentických aplikácií postavených na CUGA. Harness má skryť orchestrace, stav, guardrails a multiagentné delegovanie za jednoduchšie rozhranie.
Tím Hugging Face presunul vydávanie Python klienta huggingface_hub na týždenný rytmus cez GitHub Actions, otvorené modely a ľudské schvaľovanie tam, kde rozhoduje úsudok.
PaddlePaddle zverejnil na Hugging Face novú generáciu univerzálneho OCR modelu PP-OCRv6. Rodina cieli na praktické čítanie textu v dokumentoch, obrazovkách aj scénach a škáluje od 1,5 po 34,5 milióna parametrov.
Nový benchmark skúma nielen výsledok úlohy, ale aj cestu, počet krokov a správanie modelov pri práci s reálnymi nástrojmi a dokumentáciou.
Nový návod spája Hugging Face Hub, LeRobot a Strands Agents do jedného toku, v ktorom sa dá zozbierať demonštrácia, natrénovať politika a nasadiť ju na skutočný robot.
Omnigent je open-source meta-harness, ktorý má z jedného rozhrania spájať Claude Code, Codex, vlastných agentov a tímovú spoluprácu. Databricks tým pomenúva nový problém: firmy už nemajú jedného agenta, ale veľa agentických nástrojov bez spoločnej kontroly.
Nové vydanie inference stacku SGLang pridáva podporu ďalších autoregresívnych aj difúznych modelov a posúva Spec V2 do produkčnej roly. Pre tímy, ktoré obsluhujú veľké modely vo vlastnej infraštruktúre, je dôležitá najmä nižšia réžia schedulera a jednotnejšia cesta pre EAGLE, MTP a tree drafting.
Nový open-source balík olmo-eval cieli na hodnotenie modelov počas ich vývoja, nie až po finálnom vydaní. Pre tímy okolo otvorených modelov je to signál, že evals sa posúvajú bližšie k samotnému tréningu.
IBM Research predstavuje workflow, v ktorom jazykové modely mutujú programy generujúce kvantové opravné kódy. Systém preveril približne 200-tisíc kandidátov a našiel 465 odlišných návrhov, no jeho hodnota je najmä v tom, že LLM kombinuje s nezávislou matematickou validáciou.
OpenEnv sa presúva pod otvorenejší koordinačný model. Cieľom je spoločné prostredie, v ktorom sa budú dať trénovať a hodnotiť agentické modely pracujúce s nástrojmi.