OpenAI dáva bezpečnostné pravidlá pre frontier modely do verejného rámca
OpenAI zverejnilo Frontier Governance Framework, dokument prepájajúci interné riadenie rizík s prichádzajúcimi pravidlami EÚ a Kalifornie pre najvýkonnejšie modely.
Tag
Všetky publikované články, v ktorých sa téma bezpečnosť AI objavuje ako dôležitý kontext. Aktuálne 19 textov v archíve.
OpenAI zverejnilo Frontier Governance Framework, dokument prepájajúci interné riadenie rizík s prichádzajúcimi pravidlami EÚ a Kalifornie pre najvýkonnejšie modely.
Spoluzakladateľ Anthropic Chris Olah vystúpil pri predstavení encykliky pápeža Leva XIV. o umelej inteligencii. Firma tým posúva diskusiu o bezpečnosti AI mimo technických kruhov.
Referenčná architektúra AWS kombinuje Amazon Bedrock, Nova Pro, Guardrails a serverless služby na analýzu životopisov, otázky na pohovor a skórovanie kandidátov, no výslovne nejde o hotové produkčné riešenie.
Preprint AESOP upozorňuje na nový typ útoku proti zloženým inference pipeline. Namiesto lámana jedného modelu cieli na výber vykonávacej cesty a podľa autorov vie prudko nafúknuť výpočtové náklady aj latenciu celého systému.
OpenAI pri GPT-5.5 Instant nespravilo len bežný produktový refresh. V system card po prvý raz označuje instantný model za vysoko schopný v kybernetike aj bio rizikách a pridáva prísnejšie ochrany.
Britský AI Security Institute a Google DeepMind podpísali nové výskumné memorandum, ktoré posúva spoluprácu od samotného testovania frontier modelov k spoločnému výskumu monitorovania uvažovania modelov, socio-afektívneho zosúladenia a ekonomických dopadov AI.
Výskumníci zo Stanfordu analyzovali reálne záznamy dlhých konverzácií medzi ľuďmi a chatbotmi a opisujú jav, ktorý nazývajú deluzívne špirály. Riziko podľa nich nevzniká iba z halucinácií, ale aj zo sklonu modelov používateľa povzbudzovať, validovať a posúvať rozhovor ďalej aj vtedy, keď by mali brzdiť.