Tag

#Hugging Face

Všetky publikované články, v ktorých sa téma Hugging Face objavuje ako dôležitý kontext. Aktuálne 46 textov v archíve.

Výskum3. júna 2026

DPO mimo chatbotov: Hugging Face blog ukazuje použitie pri štruktúrovanom OCR

Dharma-AI opisuje, ako sa dá Direct Preference Optimization použiť na potláčanie opakovacích slučiek v OCR modeloch, nie iba na ladenie chatbotových odpovedí.

Modely2. júna 2026

Holo3.1 prináša lokálne modely pre agentov, ktorí ovládajú počítačové rozhrania

H Company vydala Holo3.1 na Hugging Face. Rodina modelov cieli na počítačových agentov naprieč webom, desktopom a mobilom, vrátane kvantovaných checkpointov pre lokálnu inferenciu.

Produkty2. júna 2026

IBM: škálovanie podnikových AI agentov nebude stáť iba na dlhšom kontexte

IBM Research v článku na Hugging Face tvrdí, že podnikové AI agenty potrebujú okrem väčších modelov aj explicitnú agentovú logiku: orchestráciu, pravidlá rozhodovania, guardraily a napojenie na firemné systémy. Je to praktický signál pre architektov, ktorí riešia dlhé, regulované a dynamické workflow.

Modely1. júna 2026

JetBrains uvádza Mellum2, otvorený MoE model pre rýchle textové a kódové úlohy

Mellum2 má 12 miliárd parametrov, ale pri každom tokene aktivuje približne 2,5 miliardy. JetBrains ho cez Hugging Face ponúka ako otvorený model pre routovanie, RAG, subagentov a nízkolatenčné kódové workflow.

Modely1. júna 2026

NVIDIA Cosmos 3 prináša otvorený omni-model pre fyzickú AI

NVIDIA a Hugging Face sprístupnili Cosmos 3 ako jednotný model pre generovanie svetov, fyzikálne uvažovanie a akcie. Pre robotiku a autonómne systémy je dôležité najmä to, že časť modelov, dát a nástrojov je dostupná otvorene.

Modely28. mája 2026

Hugging Face zmenšuje prenos váh pri RL tréningu z gigabajtov na megabajty

Nový mechanizmus Delta Weight Sync v TRL posiela medzi trénerom a inferenčným serverom iba zmenené časti váh. Cieľom je lacnejší a praktickejší asynchrónny RL tréning veľkých modelov.

Modely23. mája 2026

NVIDIA skúša difúzne jazykové modely Nemotron-Labs: viac tokenov naraz namiesto jedného po druhom

Nová rodina modelov Nemotron-Labs Diffusion ukazuje alternatívu k autoregresívnemu generovaniu textu: model najprv vytvorí viac tokenov paralelne a potom ich postupne opravuje. Pre firmy a vývojárov je dôležité najmä to, že NVIDIA zverejnila modely, tréningový recept aj väzbu na SGLang.

Výskum18. mája 2026

IBM a Hugging Face spúšťajú Open Agent Leaderboard pre celé agentické systémy

Nový Open Agent Leaderboard nechce merať iba model, ale celý agentický systém vrátane nástrojov, plánovania, pamäte a ceny prevádzky.

Modely14. mája 2026

IBM a Hugging Face uvádzajú Granite Embedding Multilingual R2 pre 200+ jazykov

Nová dvojica otvorených embeddingových modelov Granite Embedding Multilingual R2 s licenciou Apache 2.0 cieli na viacjazyčné vyhľadávanie, dlhý 32K kontext a nasadenie aj v menších produkčných zostavách, pričom menší 97M variant mieri na špičku medzi otvorenými modelmi pod hranicou sto miliónov parametrov.

Produkty14. mája 2026

Hugging Face ukazuje, ako asynchrónne dávkovanie skracuje inferenciu LLM bez zmeny modelu

Nový technický rozbor od Hugging Face ukazuje, že pri kontinuálnom dávkovaní LLM býva úzke hrdlo často mimo samotného modelu: ak sa príprava batchov na CPU oddelí od výpočtu na GPU, latencia a využitie akcelerátora sa môžu citeľne zlepšiť bez nových kernelov aj bez pretrénovania modelu.

Modely8. mája 2026

CyberSecQwen-4B stavia na malom lokálnom modeli pre obrannú kyberbezpečnosť

Projekt CyberSecQwen-4B tvrdí, že obranná kyberbezpečnosť potrebuje skôr malé špecializované a lokálne spustiteľné modely než ďalší univerzálny frontier systém v cloude.

Modely8. mája 2026

Hugging Face ukazuje MedQA: klinický model doladený na AMD ROCm bez CUDA

Nový projekt MedQA ukazuje, že menší klinický model Qwen3-1.7B sa dá rozumne doladiť na AMD MI300X cez ROCm bez CUDA závislostí, s LoRA a päťminútovým tréningom na vzorke MedMCQA.