1.
RUHE
2.
wenn jemand anderer meinung ist als man selbst oder wenn er scheinbar begriffsstutzig ist, dann gibt es drei möglichkeiten:
a)man versucht sein verständniss einfacher oder exakter zu erklären und mit mehr externen quellen (bevorzugt vertrauenswürdige) zu untermauern und ihn dadurch zu überzeugen
b)man akzeptiert, dass es keine einigung gibt und lässt es dabei
c)man fängt an, auf formulierungen rumzureiten und sich gegenseitig zu beleidigen.
ersteres sinn eines forums, zweites ersparrt mir jede menge spam zu lesen, letzteres führt dazu, dass ich hier bald zu mach, wenn ihr euch nicht beruhigt (und damit mein ich deutlich mehr als nur eine person)
so, sternie-pflicht erfüllt, zum thema:
vornweg: ich kann auch nur mutmaßen, aber ich nutze dazu logik und das bißchen wissen, dass sich angehäuft hat
speicherinterface: inu-ids rechenweise ist okay (wenn die ausgangsdaten stimmen), wer es noch exakter will, kann es auch von hand ausrechnen:
bandbreite (bit) x taktfrequenz (effektive, in hz!) : 8 = speicherbandbreite in byte/sekunde.
das ganze 3mal durch 1024 teilen ergibt das gleiche in gb/s.
dieser wert stimmt dann auch so und sollte den offiziellen angaben entsprechen.
auch hat die innere architektur wenig mit dem wert dieser angabe zu tun:
einziger einfluss: ein speicherinterface mit hoher bandbreite, aber niedrigem takt kann weniger oft befehle entgegennehmen und ist -wenn die leitungen nicht, wie heute üblich, in kleineren gruppen angesprochen werden- nicht in der lage, mehrere verschiedene gleichzeitig zu bearbeiten. deswegen ist höherer takt im zweifelsfall die minimal bessere lösung.
desweiteren haben speichersysteme mit weniger lesevorgängen pro takt einen vorteil (z.b. ist sdr ram besser als ddr, was besser als qdr wäre. xdr ist ne katastrophe - jeweils bei gleichem effektivem takt), da es z.b. bei ddr nicht möglich ist, zwei beliebige bits pro takt zu übertragen - sondern nur zwei in bestimmter position zueinander.
i.d.r. werden die auch so gebraucht, wenn nicht kann es aber sein, dass z.b. bei ddr1 bis zu 50% der übertragenen daten gar nicht benötigt werden.
(zählen tut hierbei das verhältniss zum letztendlichen takt der speicherzelle - bei gddr2 und gddr3 werden also z.b. 4 bits gleichzeitig gelesen, auch wenn nur
ddr dran steht)
auch das hat aber nur geringe effekte.
deswegen: entscheidend dafür, dass ein doppelt so schnelles speicherinterface die leistung nicht annäherend verdoppelt, ist nicht die interen struktur des interfaces, sondern externe strukturen:
-latenz des rams (wenn informationen schnell genug übertragen werden, aber ein abrufvorgang zu lange dauert, nützt mehr bandbreite gar nichts - limitierend ist die latenz)
-gpu (in der es n rundes dutzend flaschenhälse geben kann, je nach gpu und anwendung)
-anbindung an restliches system
-cpu
-ram
-....
wenn man alle diese werte um den faktor2 verbessert (oder eine anwendung hat, die bei einigen nur 50% der kapazität nutzt), DANN verdoppelt sich die leistung.
vorher nicht.
kleine chips/große chips:
kleine chips sind in der herstellung billiger, das stimmt.
grund: die chancen sind einfach wesentlich besser, dass von nem cm² silizium zumindest ein teil genutzt werden kann.
außerdem geht am rande des wafers weniger fläche verloren (quadrate füllen nen kreis nicht ganz auf - aber kleine quadrate lassen weniger rand frei)
aber: wie bereits angemerkt macht die gpu nur einen teil der kosten der grafikkarte aus, und zwar einen nicht unbedingt großen.
eine karte mit vielen kleinen chips kann somit durchaus teurer sein, z.b. haben ja auch gpus ihr eigenes substrat. viele gpus - viele substrate - höhere kosten (beim kentsfield nicht gegeben - da kommen zwei dies auf ein substrat, die kosten steigen nur bei der entwicklung des -komplexeren- substrates, aber da dürfte sich viel von smithfield/presler übernehmen lassen)
ob das pcb auch teurer werden würde, weiß ich nicht.
n blick auf n aktuelles pcb lässt mich mutmaßen, dass das größte problem derzeit darin besteht, 256/384/512 *2 (masse) leiterbahnen konzentriert auf ein daumennagelgroßes quadrat zuzuführen - und dabei auch noch alle auf die gleiche länge zu bringen. (wenn die signale unterschiedliche laufzeiten haben gibts probleme)
von daher könnte ein multi-gpu bord sogar billiger sein.
die kühlung wäre auf alle fälle einfacher. (statt die wärme mit ner heatpipe verteilen zu müssen, hätte man die wärmequellen verteilt)
so viel von meiner seite zu den technischen begebenheiten - wenn ich kapieren würde, was jetzt eigentlich euer aufhänger ist, könnt ich vielleicht auch noch was zur diskussion selbst beitragen
