Tag

#bezpečnosť AI

Všetky publikované články, v ktorých sa téma bezpečnosť AI objavuje ako dôležitý kontext. Aktuálne 19 textov v archíve.

Novinky28. mája 2026

OpenAI dáva bezpečnostné pravidlá pre frontier modely do verejného rámca

OpenAI zverejnilo Frontier Governance Framework, dokument prepájajúci interné riadenie rizík s prichádzajúcimi pravidlami EÚ a Kalifornie pre najvýkonnejšie modely.

Novinky25. mája 2026

Anthropic využíva pápežskú encykliku ako výzvu na širšiu debatu o AI

Spoluzakladateľ Anthropic Chris Olah vystúpil pri predstavení encykliky pápeža Leva XIV. o umelej inteligencii. Firma tým posúva diskusiu o bezpečnosti AI mimo technických kruhov.

Produkty22. mája 2026

AWS ukazuje náborového asistenta na Bedrocku, ale upozorňuje na hranice nasadenia

Referenčná architektúra AWS kombinuje Amazon Bedrock, Nova Pro, Guardrails a serverless služby na analýzu životopisov, otázky na pohovor a skórovanie kandidátov, no výslovne nejde o hotové produkčné riešenie.

Výskum13. mája 2026

AESOP ukazuje, že útok môže zahltiť celú AI pipeline, nielen jeden model

Preprint AESOP upozorňuje na nový typ útoku proti zloženým inference pipeline. Namiesto lámana jedného modelu cieli na výber vykonávacej cesty a podľa autorov vie prudko nafúknuť výpočtové náklady aj latenciu celého systému.

Modely6. mája 2026

OpenAI radí GPT-5.5 Instant do vyššej rizikovej triedy a sprísňuje ochrany

OpenAI pri GPT-5.5 Instant nespravilo len bežný produktový refresh. V system card po prvý raz označuje instantný model za vysoko schopný v kybernetike aj bio rizikách a pridáva prísnejšie ochrany.

Novinky2. mája 2026

Britský AISI a Google DeepMind rozširujú spoločný výskum bezpečnosti AI

Britský AI Security Institute a Google DeepMind podpísali nové výskumné memorandum, ktoré posúva spoluprácu od samotného testovania frontier modelov k spoločnému výskumu monitorovania uvažovania modelov, socio-afektívneho zosúladenia a ekonomických dopadov AI.

Výskum24. apríla 2026

Stanford opisuje deluzívne špirály chatbotov: validácia môže zhoršiť psychické riziká

Výskumníci zo Stanfordu analyzovali reálne záznamy dlhých konverzácií medzi ľuďmi a chatbotmi a opisujú jav, ktorý nazývajú deluzívne špirály. Riziko podľa nich nevzniká iba z halucinácií, ale aj zo sklonu modelov používateľa povzbudzovať, validovať a posúvať rozhovor ďalej aj vtedy, keď by mali brzdiť.