Mistral OCR 4 pridáva dokumentom štruktúru, polohu aj skóre istoty
Mistral predstavil OCR 4, nový model na spracovanie dokumentov so 170 jazykmi, bounding boxmi, klasifikáciou blokov a nasadením cez API alebo samostatný kontajner.
Tag
Všetky publikované články, v ktorých sa téma RAG objavuje ako dôležitý kontext. Aktuálne 17 textov v archíve.
Mistral predstavil OCR 4, nový model na spracovanie dokumentov so 170 jazykmi, bounding boxmi, klasifikáciou blokov a nasadením cez API alebo samostatný kontajner.
Preprint z University Medicine Essen opisuje on-premise systém ACIE pre klinickú extrakciu informácií. Lekári v retrospektívnej štúdii akceptovali 96,5 % extrahovaných hodnôt, no práca zároveň ukazuje, prečo bežné RAG nestačí na celé pacientske kontexty.
Pinecone zverejnil open-source stack s Prometheom a Grafanou, ktorý má tímom ukázať zdravie indexov skôr, než sa zhorší kvalita odpovedí v RAG aplikáciách.
Databricks predstavil Instructed-Retriever-1, komponent pre rýchlejšie vyhľadávanie v znalostných asistentoch. Firma tvrdí, že paralelné škálovanie pri inferencii skracuje čas vyhľadávania viac než trojnásobne bez zmeny konfigurácie používateľa.
Mistral predstavil open-source Search Toolkit, ktorý má zjednotiť ingest, retrieval a evaluáciu pre RAG a podnikové vyhľadávanie bez uzamknutia na konkrétnu infraštruktúru.
Nová dvojica otvorených embeddingových modelov Granite Embedding Multilingual R2 s licenciou Apache 2.0 cieli na viacjazyčné vyhľadávanie, dlhý 32K kontext a nasadenie aj v menších produkčných zostavách, pričom menší 97M variant mieri na špičku medzi otvorenými modelmi pod hranicou sto miliónov parametrov.
Amazon opisuje interný systém, v ktorom jeho finančné tímy používajú Bedrock, znalostné bázy a priebežné sledovanie behov na prípravu odpovedí pre regulátorov. Dôležité nie je len to, že do procesu vstúpila generatívna AI, ale aj to, ako sa rieši dohľadateľnosť, práca s dokumentmi a viacotáčkový kontext.
Nový príklad z AWS stavia retrieval nad technickými dokumentmi tak, aby systém nehľadal len v OCR texte, ale aj v kresbách, schémach a grafoch. V praxi to naznačuje, kam sa môže posunúť priemyselný RAG pri dokumentácii, kde podstatná informácia nebýva v odseku, ale v obrázku.
Nový paper FinAgent-RAG tvrdí, že pri finančných dokumentoch nestačí jednorazové vyhľadanie a odpoveď. Autori stavajú na opakovanom dohľadávaní, písaní vykonateľného kódu pre aritmetiku a smerovaní výpočtu podľa náročnosti otázky.
Nový arXiv paper navrhuje AdaGATE, tréningovo nenáročný kontrolér pre multi-hop RAG, ktorý sa snaží opravovať chýbajúce prepojenia medzi dôkazmi namiesto slepého rozširovania kontextu.
Pinecone predstavilo Nexus ako novú vrstvu nad vektorovou databázou: namiesto posielania surových dokumentov modelu chce agentom dodávať pripravený, povolený a sledovateľný kontext.
Nová ukážka z AWS opisuje, ako PwC stavia nad zmluvami AI workflow, ktoré kombinuje pravidlá, prirodzené otázky a citácie na konkrétne pasáže. Dôležité nie je len zrýchlenie, ale aj posun od vyhľadávania klauzúl k štruktúrovanému a auditovateľnému získavaniu poznatkov.