Kategória

AI výskum

Výskumné práce, metódy, reprodukovateľné výsledky a posuny v bezpečnosti modelov.

Filter podľa tagov

Všetko #arXiv 102 #výskum 54 #benchmarky 36 #LLM 34 #AI agenti 20 #Apple 19 #počítačové videnie 17 #agenti 15 #Hugging Face 13 #reasoning 13 #reinforcement learning 10 #strojové učenie 10 #AI výskum 9 #multimodálne modely 8

Výskum10. júna 2026

ServiceNow testuje, ako hlasoví agenti zvládajú prepínanie jazykov

Benchmark na Hugging Face ukazuje, že rozpoznávanie reči v dvojjazyčných kontaktných centrách zostáva pre hlasových agentov slabým miestom.

Výskum9. júna 2026

Preprint skúša presnejšie riadenie kompozície pri generovaní krajiniek

Nový arXiv preprint navrhuje anchor-conditioned fine-tuning pre generovanie krajinných obrázkov. Model nedostáva iba textový prompt, ale aj číselný vektor kompozície, ktorý má lepšie zachytiť horizont, dominantný objekt či priestorové rozloženie scény.

Výskum9. júna 2026

NIST: matematický dôkaz podporuje priebežné opravy AI bezpečnosti

NIST upozorňuje, že konečný zoznam guardrailov nemôže byť univerzálne odolný voči protivníckym promptom. Práca Apostola Vassileva podporuje prechod k nepretržitému monitorovaniu, red teamingu a prevádzkovej odolnosti.

Výskum9. júna 2026

Preprint rozoberá, čo adversariálne dolaďovanie mení vo vision transformeroch

Nová práca z MIT analyzuje, ako adversariálne fine-tuningové postupy ovplyvňujú vision transformery pri rozmazaní, zaostrení a iných obrazových poruchách. Zlepšenie robustnosti sa podľa autorov neprenáša automaticky na nevidené typy porúch.

Výskum9. júna 2026

Štúdia testuje AI agentov na vedeckom potrubí od dát po objav v neurovede

Nový preprint hodnotí všeobecných kódovacích agentov na optogenetickom výskumnom potrubí s veľkými dátami. Výsledok je triezvy: agenti zvládajú niektoré samostatné kroky, ale zlyhávajú pri end-to-end vedeckom úsudku.

Výskum8. júna 2026

OpenAI spúšťa výskumnú burzu o vplyve AI na prácu a ekonomiku

OpenAI otvorilo Economic Research Exchange, program pre externé empirické projekty o tom, ako AI mení produktivitu, pracovné miesta, firmy a verejné inštitúcie.

Výskum8. júna 2026

Stanford varuje, že náborové AI nástroje môžu škálovať rasové odmietanie uchádzačov

Stanford HAI opisuje veľkú štúdiu algoritmického náboru: pri 4 miliónoch žiadostí mala spoločná závislosť firiem od jedného dodávateľa zvýrazniť rasové rozdiely a systémové odmietanie rovnakých kandidátov.

Výskum8. júna 2026

Preprint o hyperspektrálnych dátach varuje pred únikom v náhodných pixelových testoch

Metóda SGBR-HC vyberá približne dvadsať pásiem pre hyperspektrálnu klasifikáciu a zároveň ukazuje, že náhodné delenie pixelov môže nafúknuť presnosť o desiatky percentuálnych bodov. Dôležitý je preto priestorovo oddelený test.

Výskum8. júna 2026

AFSAT prenáša pseudo-booleovský SAT solver na GPU cez JAX a Fourierove reprezentácie

Preprint predstavuje AFSAT, plnohodnotnejšiu verziu GPU solvera pre pseudo-booleovské SAT úlohy. Autori opisujú, ako JAX, dávkové lokálne hľadanie a upravená diskrétna Fourierova transformácia zlepšujú stabilitu, pamäť aj škálovanie.

Výskum8. júna 2026

Nový preprint rozkladá activation steering na uhol a veľkosť skrytého stavu

Štúdia na siedmich jazykových modeloch ukazuje, že pri riadení správania modelu nestačí sledovať iba smer zásahu. Uhol nesie väčšinu konceptovej informácie, no veľkosť skrytého stavu rozhoduje o stabilite a vedľajších účinkoch.

Výskum6. júna 2026

Preprint analyzuje, ako skrytí LLM agenti presviedčali ľudí na Reddite

Nová štúdia skúma dataset z prerušeného experimentu na r/ChangeMyView, kde neoznačené AI účty vstupovali do živých debát. Autori analyzujú identitu, autoritatívne signály a rétorické taktiky a tvrdia, že samotné pravidlá o zverejnení AI pôvodu nemusia stačiť.

Výskum6. júna 2026

TimeClaw dáva všeobecným agentom nástroje na prácu s časovými radmi

Preprint TimeClaw navrhuje harness pre všeobecných LLM agentov, ktorí majú analyzovať časové rady v kontexte reálnych workflowov. Namiesto čisto textového uvažovania pridáva vykonateľné temporálne nástroje, pamäť a opakovateľné analytické rutiny.