CyberSecQwen-4B stavia na malom lokálnom modeli pre obrannú kyberbezpečnosť
Projekt CyberSecQwen-4B tvrdí, že obranná kyberbezpečnosť potrebuje skôr malé špecializované a lokálne spustiteľné modely než ďalší univerzálny frontier systém v cloude.
Kategória
Nové foundation modely, benchmarky, multimodálne schopnosti a vývoj inferencie.
Projekt CyberSecQwen-4B tvrdí, že obranná kyberbezpečnosť potrebuje skôr malé špecializované a lokálne spustiteľné modely než ďalší univerzálny frontier systém v cloude.
Nový projekt MedQA ukazuje, že menší klinický model Qwen3-1.7B sa dá rozumne doladiť na AMD MI300X cez ROCm bez CUDA závislostí, s LoRA a päťminútovým tréningom na vzorke MedMCQA.
OpenAI rozširuje Realtime API o trojicu hlasových modelov, ktoré majú posunúť hlasové rozhrania od jednoduchého dialógu k praktickému vykonávaniu úloh, priebežnému prekladu a živému prepisu reči.
OpenAI pri GPT-5.5 Instant nespravilo len bežný produktový refresh. V system card po prvý raz označuje instantný model za vysoko schopný v kybernetike aj bio rizikách a pridáva prísnejšie ochrany.
AWS popisuje, ako pri reinforcement fine-tuningu modelov Amazon Nova nahradiť časť ručne písaných reward funkcií hodnotiacim modelom. Tvrdí, že prístup LLM-as-a-judge je vhodnejší tam, kde treba naraz sledovať presnosť, tón, bezpečnosť aj formát výstupu.
OpenAI opísalo, ako sa z drobnej odchýlky v odmeňovaní pri ladení osobnosti stala viditeľná črta modelu. Príbeh je zaujímavý najmä tým, že nejde o jeden veľký bug, ale o pomalé šírenie malých preferencií naprieč generáciami modelu.
IBM detailne rozpisuje, ako vznikla rodina Granite 4.1. Nové dense modely s veľkosťou 3B, 8B a 30B kombinujú päťfázový tréning, dlhý kontext a Apache 2.0 licenciu, aby boli zrozumiteľnou open alternatívou pre firmy aj vývojárov.
NVIDIA uviedla multimodálny model Nemotron 3 Nano Omni a AWS ho sprístupnilo v SageMaker JumpStart v deň vydania. Zaujímavý je najmä tým, že má slúžiť ako jednotný percepčný model pre dokumenty, obrazovky, zvuk aj video v agentických workflow.
DeepSeek predstavil radu V4 s miliónovým kontextom, no podstatnejší je iný posun: firma tvrdí, že nové modely výrazne znižujú priebežné výpočtové náklady aj pamäťové nároky pri veľmi dlhých behoch. To je dôležité najmä pre agentov, ktorí si do kontextu nesú históriu nástrojov, logov a medzikrokov.
OpenAI uviedlo GPT-5.5 ako nový vlajkový model pre kódovanie, prácu s nástrojmi a dlhšie agentické workflow. Firma tvrdí, že novinka posúva kvalitu práce v Codexe aj ChatGPT, no pritom drží latenciu na úrovni GPT-5.4 a pridáva prísnejšie bezpečnostné testovanie.
NVIDIA na Hugging Face ukázala demo, v ktorom Gemma 4 na malom zariadení Jetson Orin Nano Super kombinuje reč, obraz aj odpoveď syntetizovaným hlasom. Silným signálom nie je len samotné demo, ale predstava multimodálneho agenta, ktorý vie fungovať lokálne na edge hardvéri.
Amazon zverejnil architektúru, ktorá spája open-source model Parakeet-TDT, AWS Batch a spotové GPU inštancie pri veľkoobjemovom prepise audia. Signálom nie je len technický návod, ale aj rastúci tlak na lacnejšie multimodálne pipeline mimo uzavretých API služieb.