Preprint skúma, či multimodálne modely stačia na asistívne aplikácie v reálnom svete
Štúdia o MLLM v asistívnej AI upozorňuje, že vizuálne porozumenie, kontext a viacjazyčnosť musia fungovať spoľahlivo naraz, nie iba v izolovaných benchmarkoch.
Tag
Všetky publikované články, v ktorých sa téma bezpečnosť objavuje ako dôležitý kontext. Aktuálne 15 textov v archíve.
Štúdia o MLLM v asistívnej AI upozorňuje, že vizuálne porozumenie, kontext a viacjazyčnosť musia fungovať spoľahlivo naraz, nie iba v izolovaných benchmarkoch.
Preprint o AgenticRei tvrdí, že podnikové AI agenty nemožno riadiť iba pravidlami povoliť alebo zakázať. Navrhuje runtime politiku s povinnosťami, výnimkami a riešením konfliktov mimo samotného jazykového modelu.
Cloudflare zverejnil architektúru interného systému, ktorý spája AI modely, stavové kontroly a protivnícku validáciu pri hľadaní bezpečnostných chýb v rozsiahlych kódbázach.
ServiceNow a Hugging Face opisujú benchmark, v ktorom agenti skladajú odpovede z verejných aj súkromných dát. Únik môže vzniknúť už v postupnosti externých dopytov.
GPT-5.5 Instant má podľa OpenAI výrazne lepšie zvládať zdravotné otázky, pracovať s kontextom a častejšie pomenovať neistotu či potrebu odbornej starostlivosti.
Nové vydania Pydantic AI prinášajú opravu bezpečnostného problému, pri ktorom mohol klient cez providerMetadata podstrčiť UploadedFile odkaz a prinútiť server čítať súbory pod vlastnými oprávneniami.
Projekt z Hugging Face Build Small Hackathon používa malý open-weight model, Urdu rozhranie a jasný bezpečnostný rozsah na triedenie podozrivých bankových, kuriérskych či úradných správ v Pakistane.
Tím vedený NIST opisuje model Safe Step, ktorý v pôdoryse budovy vyhodnocuje bezpečné únikové trasy pri požiari. Systém sa má dať prepojiť s dynamickými elektronickými značkami a zatiaľ cieli na jednopodlažné budovy.
PydanticAI vydal verzie 1.102.0 a 2.0.0b3 s bezpečnostnou opravou pre špecifický prípad URL validácie. Riziko sa týka aplikácií, ktoré explicitne povolia sťahovanie lokálnych URL cez force_download='allow-local' a bežia v sieťach s NAT64 alebo ISATAP.
OpenAI prvýkrát detailnejšie opisuje, ako interne riadi kódujúceho agenta Codex. Namiesto voľného prístupu stavia na sandboxe, jemnom dávkovaní oprávnení, obmedzenej sieti a auditných stopách priamo na úrovni agentických akcií.
OpenAI získalo autorizáciu FedRAMP Moderate pre ChatGPT Enterprise a API Platform. Krok otvára firmu pre širšie federálne nasadenia a zároveň ukazuje, že boj o verejný sektor sa bude čoraz viac točiť okolo bezpečnosti, auditu a prevádzkovej dôvery.
OpenAI otvorilo nový bio-bezpečnostný bug bounty program pre GPT-5.5. Hľadá výskumníkov, ktorí by vedeli jedným univerzálnym promptom prelomiť päť biologických bezpečnostných otázok bez toho, aby zasiahla moderácia.