DPO mimo chatbotov: Hugging Face blog ukazuje použitie pri štruktúrovanom OCR
Dharma-AI opisuje, ako sa dá Direct Preference Optimization použiť na potláčanie opakovacích slučiek v OCR modeloch, nie iba na ladenie chatbotových odpovedí.
Tag
Všetky publikované články, v ktorých sa téma Hugging Face objavuje ako dôležitý kontext. Aktuálne 46 textov v archíve.
Dharma-AI opisuje, ako sa dá Direct Preference Optimization použiť na potláčanie opakovacích slučiek v OCR modeloch, nie iba na ladenie chatbotových odpovedí.
H Company vydala Holo3.1 na Hugging Face. Rodina modelov cieli na počítačových agentov naprieč webom, desktopom a mobilom, vrátane kvantovaných checkpointov pre lokálnu inferenciu.
IBM Research v článku na Hugging Face tvrdí, že podnikové AI agenty potrebujú okrem väčších modelov aj explicitnú agentovú logiku: orchestráciu, pravidlá rozhodovania, guardraily a napojenie na firemné systémy. Je to praktický signál pre architektov, ktorí riešia dlhé, regulované a dynamické workflow.
Mellum2 má 12 miliárd parametrov, ale pri každom tokene aktivuje približne 2,5 miliardy. JetBrains ho cez Hugging Face ponúka ako otvorený model pre routovanie, RAG, subagentov a nízkolatenčné kódové workflow.
NVIDIA a Hugging Face sprístupnili Cosmos 3 ako jednotný model pre generovanie svetov, fyzikálne uvažovanie a akcie. Pre robotiku a autonómne systémy je dôležité najmä to, že časť modelov, dát a nástrojov je dostupná otvorene.
Nový mechanizmus Delta Weight Sync v TRL posiela medzi trénerom a inferenčným serverom iba zmenené časti váh. Cieľom je lacnejší a praktickejší asynchrónny RL tréning veľkých modelov.
Nová rodina modelov Nemotron-Labs Diffusion ukazuje alternatívu k autoregresívnemu generovaniu textu: model najprv vytvorí viac tokenov paralelne a potom ich postupne opravuje. Pre firmy a vývojárov je dôležité najmä to, že NVIDIA zverejnila modely, tréningový recept aj väzbu na SGLang.
Nový Open Agent Leaderboard nechce merať iba model, ale celý agentický systém vrátane nástrojov, plánovania, pamäte a ceny prevádzky.
Nová dvojica otvorených embeddingových modelov Granite Embedding Multilingual R2 s licenciou Apache 2.0 cieli na viacjazyčné vyhľadávanie, dlhý 32K kontext a nasadenie aj v menších produkčných zostavách, pričom menší 97M variant mieri na špičku medzi otvorenými modelmi pod hranicou sto miliónov parametrov.
Nový technický rozbor od Hugging Face ukazuje, že pri kontinuálnom dávkovaní LLM býva úzke hrdlo často mimo samotného modelu: ak sa príprava batchov na CPU oddelí od výpočtu na GPU, latencia a využitie akcelerátora sa môžu citeľne zlepšiť bez nových kernelov aj bez pretrénovania modelu.
Projekt CyberSecQwen-4B tvrdí, že obranná kyberbezpečnosť potrebuje skôr malé špecializované a lokálne spustiteľné modely než ďalší univerzálny frontier systém v cloude.
Nový projekt MedQA ukazuje, že menší klinický model Qwen3-1.7B sa dá rozumne doladiť na AMD MI300X cez ROCm bez CUDA závislostí, s LoRA a päťminútovým tréningom na vzorke MedMCQA.