aifeed.skAI Feed

Tag

#GPU infraštruktúra

Všetky publikované články, v ktorých sa téma GPU infraštruktúra objavuje ako dôležitý kontext. Aktuálne 3 textov v archíve.

SGLang 0.5.13 mení špekulatívne dekódovanie na predvolenú cestu
Produkty

SGLang 0.5.13 mení špekulatívne dekódovanie na predvolenú cestu

Nové vydanie inference stacku SGLang pridáva podporu ďalších autoregresívnych aj difúznych modelov a posúva Spec V2 do produkčnej roly. Pre tímy, ktoré obsluhujú veľké modely vo vlastnej infraštruktúre, je dôležitá najmä nižšia réžia schedulera a jednotnejšia cesta pre EAGLE, MTP a tree drafting.