Op deze website gebruiken we cookies om content en advertenties te personaliseren, om functies voor social media te bieden en om ons websiteverkeer te analyseren. Ook delen we informatie over uw gebruik van onze site met onze partners voor social media, adverteren en analyse. Deze partners kunnen deze gegevens combineren met andere informatie die u aan ze heeft verstrekt of die ze hebben verzameld op basis van uw gebruik van hun services. Meer informatie.

Akkoord

Vraag & Antwoord

Videokaarten en monitoren

Pipeline architectuur en TMU's

None
5 antwoorden
  • Hoe zit het nu?

    Je hebt de Geforce FX die met 4 pipelines net zo snel is als de Radeon 9700 met 8 pipelines. Dat heeft dus te maken met het x? geval. Red dragon legde mij uit dat:

    4x2 net zo snel is als 8x1

    Hoe zit dat dan? Wat is dan het verschil? TMU? Wat is dat dan precies?

    En als ik op de site van ATI lees zie ik daar zo staan 8 pipeline architectuur die met 16 textures kan werken? Heeft dat dan iets te maken met 8x2?

    :o
  • TMU is Texture Mapping Unit.
    Het aantal TMU's in de pipeline bepalen hoeveel textures per clock kunnen worden ingelezen. Het aantal pipelines bepalen de hoeveelheid texels (pixel in een texture) per clockcyclus.

    De ATI Radeon 9800 refereert naar 16 textures per pass. Dit zou dan moeten betekenen dat de Radeon 9800 met 1 TMU 16x een loopback kan doen om aan het aantal van 16 textures te kunnen komen (indien dit aanwezig is !) In de praktijk heb ik nog geen toepassingen gezien waarvoor meer dan 4 textures layers worden gebruikt. Dit betekend dat de Radeon 9800 4x een loopback moet doen en dus 4 clockcyclussen kwijt is voor het gereedmaken van 4 textures. Deze kunnen vervolgens in 1 pass gerenderd worden.

    De GeForceFX heeft twee TMU's per pipe en heeft voor het verzamelen van 4 textures dus twee clockcyclussen nodig. Dit geeft nVidia dus een voordeel. Alleen heeft nVidia weer een nadeel omdat het maar vier pipelines heeft in plaats van 8. Om dit verschil te verduidelijken geef ik even een heel plat voorbeeld.

    Stel je wilt 8 texels uit een vier layer model halen.

    Met 8 pipes en 1 TMU heb je 4 clockcyclussen nodig. Met 4 pipes en 2 TMU's/pipe heb je ook 4 clockcyclussen nodig.

    Zou het om drie layers gaan en 8 texels dan:
    Met 8 pipes en 1TMU gebruik je 3 clockcyclussen, maar met 4 pipes en 2TMU heb je er weer 4 nodig. Je hebt dus bij de 2de en 4de clock cyclus niet alle TMU's nodig. Slechts 1 !!

    Maar je kunt de zaak ook verdraaien door bijvoorbeeld 9 texels te halen uit een vier layer.
    Voor een 8x1 heb je 8 clockcyclussen nodig. Voor een 4x2 heb je 6 clockcyclussen nodig.

    Om het nog anders te maken.
    4 texels uit een 4-layer
    8x1 is 4 clockcyclussen en een 4x2 is 2 clockcyclussen !!!
    In dit geval heeft nVidia voordeel. Deze situatie zie je in hoeken en aan randen van polygonen en in hele kleine polygonen die soms maar 1 pixel groot zijn maar wel 4 layers hebben !!
    Een pipeline kan maar aan 1 polygoon tegelijk werken. Dit betekend dat er in heel veel gevallen niet genoeg texels zijn die alle 8 pipelines kunnen vullen. Er staan dus pipelines niks te doen !!! En als een pipeline niks doet doet ook de TMU die daarin zit niks… Dus verspilling van silicium. ATI en nVidia proberen dus zo optimaal mogelijk het silicium te gebruiken. (silicium is materiaal waarmee de transistoren gemaakt worden)

    Dus zo heel slecht is de keuze van nVidia niet. En dan gebruikt nVidia ook nog 500MHz en ATI 380MHz. Dus een clockcyclus is op een FX sneller dan op een Radeon 9800pro
  • In games met multi textuering is 4x2 meestal net zo snel als 8x1, in dat geval heeft de game 2 texture lagen en worden per kloktik 8 texturelagen berekend, dus net zoveel als 8x1

    In single texturegames zal een 8x1 oplossing dus sneller kunnen zijn als er geen andere factoren zoals overdraw, polygonen een grote rolspelen, anders hebben die ook invloed.

    In dx9 kan de 8x1 oplossing van ATI een backwards loop maken zodat dan 16 textures per kloktik gerenderd kunnen worden.

    De gffx moet dat ook kunnen, alleen ik weet niet precies hoe het daar gaat.

    Dat kan Slashhead veel beter uitleggen, zoveel kaas heb ik er nou ook weer niet van gegeten, maar daar wil ik wel eens verandering in brengen ;)


    edit:

    aah net te laat…..
  • Mmm, het is me nu redelijk duidelijk. (moeilijk taalgebruik) Mocht ik nog met vragen komen, post ik ze hier.

    Bedankt alvast…
  • Ik ben blij dat we Slashhead hier hebben, want dit gaat mij ook te ver om het zo goed uit te leggen.

    Slashhead bedankt! :)

Beantwoord deze vraag

Dit is een gearchiveerde pagina. Antwoorden is niet meer mogelijk.