Selon un rapport de Financial Associated Press du 15 août, JD Cloud a lancé une solution de pooling vGPU pour fournir une solution unique de pooling de puissance de calcul GPU Le taux d'utilisation du GPU peut être augmenté jusqu'à 70%, ce qui réduit considérablement le coût de l'inférence de grands modèles.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Selon un rapport de Financial Associated Press du 15 août, JD Cloud a lancé une solution de pooling vGPU pour fournir une solution unique de pooling de puissance de calcul GPU Le taux d'utilisation du GPU peut être augmenté jusqu'à 70%, ce qui réduit considérablement le coût de l'inférence de grands modèles.