Kategória

AI modely

Nové foundation modely, benchmarky, multimodálne schopnosti a vývoj inferencie.

Filter podľa tagov

Všetko #Hugging Face 17 #NVIDIA 9 #multimodalita 8 #open-source 8 #agenti 6 #Nemotron 6 #OpenAI 5 #AWS 4 #LLM 4 #multimodálne modely 4 #robotika 4 #Ai2 3 #Anthropic 3 #audio AI 3

Modely8. mája 2026

CyberSecQwen-4B stavia na malom lokálnom modeli pre obrannú kyberbezpečnosť

Projekt CyberSecQwen-4B tvrdí, že obranná kyberbezpečnosť potrebuje skôr malé špecializované a lokálne spustiteľné modely než ďalší univerzálny frontier systém v cloude.

Modely8. mája 2026

Hugging Face ukazuje MedQA: klinický model doladený na AMD ROCm bez CUDA

Nový projekt MedQA ukazuje, že menší klinický model Qwen3-1.7B sa dá rozumne doladiť na AMD MI300X cez ROCm bez CUDA závislostí, s LoRA a päťminútovým tréningom na vzorke MedMCQA.

Modely7. mája 2026

OpenAI posúva hlas v API: nové realtime modely zvládnu preklad, prepis aj silnejšie uvažovanie

OpenAI rozširuje Realtime API o trojicu hlasových modelov, ktoré majú posunúť hlasové rozhrania od jednoduchého dialógu k praktickému vykonávaniu úloh, priebežnému prekladu a živému prepisu reči.

Modely6. mája 2026

OpenAI radí GPT-5.5 Instant do vyššej rizikovej triedy a sprísňuje ochrany

OpenAI pri GPT-5.5 Instant nespravilo len bežný produktový refresh. V system card po prvý raz označuje instantný model za vysoko schopný v kybernetike aj bio rizikách a pridáva prísnejšie ochrany.

Modely1. mája 2026

AWS ukazuje, ako ladiť Amazon Nova cez LLM-judge namiesto ručne písaných rewardov

AWS popisuje, ako pri reinforcement fine-tuningu modelov Amazon Nova nahradiť časť ručne písaných reward funkcií hodnotiacim modelom. Tvrdí, že prístup LLM-as-a-judge je vhodnejší tam, kde treba naraz sledovať presnosť, tón, bezpečnosť aj formát výstupu.

Modely30. apríla 2026

OpenAI vysvetľuje, prečo sa v GPT-5 začali množiť „goblini“

OpenAI opísalo, ako sa z drobnej odchýlky v odmeňovaní pri ladení osobnosti stala viditeľná črta modelu. Príbeh je zaujímavý najmä tým, že nejde o jeden veľký bug, ale o pomalé šírenie malých preferencií naprieč generáciami modelu.

Modely29. apríla 2026

IBM Granite 4.1 stavia na 15 biliónoch tokenov a kontexte do 512-tisíc

IBM detailne rozpisuje, ako vznikla rodina Granite 4.1. Nové dense modely s veľkosťou 3B, 8B a 30B kombinujú päťfázový tréning, dlhý kontext a Apache 2.0 licenciu, aby boli zrozumiteľnou open alternatívou pre firmy aj vývojárov.

Modely28. apríla 2026

NVIDIA Nemotron 3 Nano Omni spája obraz, zvuk aj video do jedného open modelu

NVIDIA uviedla multimodálny model Nemotron 3 Nano Omni a AWS ho sprístupnilo v SageMaker JumpStart v deň vydania. Zaujímavý je najmä tým, že má slúžiť ako jednotný percepčný model pre dokumenty, obrazovky, zvuk aj video v agentických workflow.

Modely24. apríla 2026

DeepSeek-V4 tlačí milión tokenov do praxe: open model mieri na dlhé agentické úlohy

DeepSeek predstavil radu V4 s miliónovým kontextom, no podstatnejší je iný posun: firma tvrdí, že nové modely výrazne znižujú priebežné výpočtové náklady aj pamäťové nároky pri veľmi dlhých behoch. To je dôležité najmä pre agentov, ktorí si do kontextu nesú históriu nástrojov, logov a medzikrokov.

Modely23. apríla 2026

GPT-5.5 mieri na dlhšie úlohy: OpenAI pridáva výkon bez vyššej latencie

OpenAI uviedlo GPT-5.5 ako nový vlajkový model pre kódovanie, prácu s nástrojmi a dlhšie agentické workflow. Firma tvrdí, že novinka posúva kvalitu práce v Codexe aj ChatGPT, no pritom drží latenciu na úrovni GPT-5.4 a pridáva prísnejšie bezpečnostné testovanie.

Modely23. apríla 2026

Gemma 4 beží na Jetson Orin Nano ako lokálny hlasovo-vizuálny agent

NVIDIA na Hugging Face ukázala demo, v ktorom Gemma 4 na malom zariadení Jetson Orin Nano Super kombinuje reč, obraz aj odpoveď syntetizovaným hlasom. Silným signálom nie je len samotné demo, ale predstava multimodálneho agenta, ktorý vie fungovať lokálne na edge hardvéri.

Modely23. apríla 2026

AWS ukazuje lacný prepis zvuku s Parakeet-TDT a Batchom

Amazon zverejnil architektúru, ktorá spája open-source model Parakeet-TDT, AWS Batch a spotové GPU inštancie pri veľkoobjemovom prepise audia. Signálom nie je len technický návod, ale aj rastúci tlak na lacnejšie multimodálne pipeline mimo uzavretých API služieb.