Реферат: Що нас чекає найближчим часом у світі 3D графіки
15 мільйонів транзисторів
Для візуалізації 3D графіки з фотореалістичною якістю чип NV10 повинний буде мати дуже могутній процесор, що працює з високою частотою (MHz) і обладающий могутнім блоком операцій з речовинними числами (FPU) для акселерації геометрії.
Якщо знову звернутися до роадмап від nVidia, то можна знайти, що чип NV10 буде містити 15 мільйонів транзисторів. Приблизно стільки ж транзисторів буде в процесорі Intel Merced 800 MHz. Можна припустити, що через таке величезне число транзисторів при виробництві NV10 буде використовуватися технологічний процес 0.18 мкм чи навіть 0.15 мкм, що, у свою чергу, дозволить використовувати більш високі робочі частоти в порівнянні із сучасними чипами 3D графічних акселераторів. З іншого боку, на ринку вже є чипы з 50 мільйонами транзисторів в одному кристалі, і роблять їх по 0.25 мкм технології, це, наприклад, Fuzion 150 від PixelFusion. Перехід з 0.25 мкм технологічного процесу на 0.18 мкм чи 0.15 мкм процес дозволить не тільки скоротити площа кристала, але також вирішить проблему підвищеного тепловиділення при високих робочих частотах. Недавно з'явився на ринку процесор Athlon від AMD (кодове ім'я K7) працює на частотах до 650 MHz включно, причому це ще не межа. Тому цілком природно припустити, що робітники частоти нового покоління графічних процесорів також зростуть. Принаймні, є всі підстави очікувати, що NV10 буде працювати на стандартній частоті 250 MHz чи навіть 300 MHz, що на 40% більше, ніж максимальна частота (стандартна) сучасних чипов (183 MHz). Зрозуміло, чипы NV10 будуть мати радіатор і вентилятор для гарного охолодження, що набагато краще холодильних установок. Також, немає причин сумніватися, що NV10 буде розганятися до більш високих частот, хоча б на 10%.
Більше пам'яті, гарної і швидкий
Акселератори 3D графіки в процесі своєї роботи найбільше інтенсивно використовують пам'ять тільки на етапі рендеринга, коли інформація про полігони розміщається в текстурних буферах перед відображенням. Крім того, пам'ять потрібна для Z-буферизации і для кадрових буферів. Сучасні відеоадаптери для споживчого ринку мають до 32 Мб локальної відеопам'яті, наприклад, карти на чипе TNT2. Професійні відеоакселератори, наприклад, Oxygen від 3Dlabs, мають до 256 Мб локальної пам'яті. Зрозуміло, що чим більше пам'яті відведено під текстури, тим більше складну графіку можна відтворити. У принципі, під текстурну пам'ять можна використовувати оперативну пам'ять комп'ютера, власне, для цього і придумали AGP. Однак виникають проблеми із шириною смуги пропущення при перекачуванні текстурних даних. Навіть при використанні AGP x4 і технологій компресії текстур збереження текстурних даних у системній пам'яті комп'ютера може виявитися вузьким місцем. Тому, особливо з огляду на зниження цін на пам'ять, немає ніяких підстав, припускати, що відеоадаптери на базі чипов наступного покоління будуть мати скромні обсяги локальної пам'яті. Тому що основним достоїнством нового покоління графічних акселераторів буде можливість візуалізації фотореалістичної графіки, те можна змело затверджувати, що 64 Мб локальної пам'яті буде стандартним рішенням. Роадмап Diamond щодо карт на NV10 це побічно підтверджує. З іншого боку, зараз на ринку чітко проглядається тенденція сегментації карт, коли для кожного сектора пропонуються графічні акселератори з різною комплектацією обсягів локальної пам'яті. Можна припустити, що будуть версії карт на базі чипов нового покоління з 32 Мб і навіть з 16 Мб на борті. Не виключено, що пам'ять на таких картах можна буде розширити.
Передбачається, що на базі NV10 буде випускатися аж до п'яти різних версій карт:
OEM версії з 16/32 Мб локальної пам'яті
Стандартна версія з 64 Мб
Ultra версія з 128 Мб
Професійна версія з 192 Мб
Special Edition версія з 256 Мб
Зрозуміло, це усього лише припущення.
З іншого боку, є інформація, що карти на Voodoo4/Napalm будуть поставлятися в комплектації аж до 128 Мб локальної пам'яті. Навряд чи nVidia допустить відставання від конкурента по цьому параметрі.
Тепер що стосується типу локальної пам'яті для графічних акселераторів. Сьогодні найпоширенішим є пам'ять типу SDRAM/SGRAM. Самим логічним кроком буде перехід на використання DDR SDRAM/SGRAM, що навіть при незмінних тактових частотах збільшить продуктивність пам'яті вдвічі. Крім того, не виключений варіант використання екзотичних типів чи пам'яті комбінування різних типів пам'яті. Не виключено, що ми побачимо на платах непрофесійного класу двухпортовую відеопам'ять, наприклад, 3DRAM від Mitsubishi. А як спеціалізовану пам'ять для збереження текстур можна використовувати CDRAM (Cached DRAM) від усі тієї ж Mitsubishi. Очікується, що вже до кінця цього року ми, нарешті, побачимо плати на чипе Verite4000 від Rendition/Micron, відмітною рисою яких буде застосування Embedded DRAM. З іншого боку, використання екзотичних видів пам'яті може сильно подорожчати систему в цілому. Тому більш ймовірним представляється все-таки шлях розвитку технологій, що підвищують ефективність існуючих рішень. Наприклад, технологія стиску текстур S3TC, уже включена в Direct3D, дозволяє більш ефективно використовувати AGP текстурирования, фактично збільшуючи пропускну здатність шини AGP при перекачуванні текстур. Поки ця технологія не одержала широкого поширення, але, наприклад, крім самої S3, про підтримку S3TC заявили вже Matrox, VideoLogic, а, по наявним даної, Voodoo4 теж буде підтримувати цю техніку стиску текстур. Крім того, не виключено, що буде прийнята на озброєння технологія менеджменту (Virtual Textures) і кэширования текстур, застосовувана 3Dlabs у їх чипе Permedia3. Суть її в тім, що кэширование текстур відбувається за рахунок локальної відеопам'яті, а самі текстури зберігаються в системній пам'яті комп'ютера і можуть мати гігантські розміри, при цьому завантажуватися може лише та їхня частина, що дійсно необхідна. Далі, цілком логічно очікувати збільшення ширини шини чи пам'яті використання декількох незалежних шин пам'яті, наприклад, як 256-bit Dual Bus у серії G400 від Matrox.
Висновок
Отже, у принципі зрозуміло, чого варто очікувати від графічних процесорів наступного покоління і плат на їхній основі. Можна укласти, що 2001 рік буде початком широкого застосування 3D графіки фотореалістичної якості на масовому ринку. Сучасні 3D акселератори забезпечують високу швидкість візуалізації, так що в новому поколінні упор буде зроблений, швидше за все, саме на якість зображення. Широке поширення одержать технології рельєфного текстурирования, анізотропна фільтрація і передові техніки затінення, наприклад, Фонга. Що стосується конкретних специфікацій чипов, те навіть при відсутності офіційних даних можна зробити деякі екстраполяції. Зрозуміло, що всі ті функції, за відсутність підтримки яких сьогодні лають 3dfx і їх чип Voodoo3, будуть реалізовані в Voodoo4. Це значить, що буде підтримка 32-бітного рендеринга, 32-бітної z-буферизации, AGP-текстурирования. Будуть підтримуватися стенсели і текстури великого розміру. Є всі підстави припускати, що в чипах нового покоління будуть широко застосовуватися кілька конвеєрів і кілька блоків текстурирования. Це дозволить реалізовувати виконання за один такт просунутих технік рельєфного текстурирования і фільтрації. Можливо, ми побачимо графічні процесори, що здатні накладати за один такт не дві, а три, чотири, і навіть вісім текстур. Це дозволить створювати більш природні ландшафти віртуального світу з природним висвітленням. Не виключений перехід до використання більш складних примітивів, ніж трикутники, наприклад, квадратичних полігонів. Наявність великих обсягів швидкої локальної пам'яті дозволить повною мірою використовувати переваги згладжування всієї сцени (full scene antialiasing) з довільно обираними коефіцієнтами суперсемплинга. Далі, є імовірність, що широке поширення можуть одержати технології типу SLI чи PGC, хоча шансів на це небагато.
Що стосується додатків, що можуть використовувати переваги геометричної акселерації, то отут варто дати одне пояснення. Не варто очікувати, що, поставивши у свій могутній (чи не дуже могутній) комп'ютер відеоакселератор з геометричним співпроцесором, ви побачите величезний приріст швидкості і якості відображуваної 3D графіки. На жаль, цього не відбудеться, тому що в більшості ігор використовується спеціалізований движок, що, зокрема, займається розрахунком T & L, перекладаючи обчислювальне навантаження на CPU системи. Крім того, у грі можуть використовуватися і можливості стандартних API, таких, як Direct3D і OpenGL, але розроблювачі віддають перевагу спеціалізованим движкам, тому що в цьому випадку гра йде швидше при використанні ресурсів CPU. З появою підтримки в Direct3D геометричних акселераторів ситуація може змінитися і відбудеться відмовлення від спеціалізованих ігрових движків, що покладаються тільки на ресурси CPU.
Так, нагадаємо ще одну деталь щодо Direct 7.0, а саме той факт, що тепер у розроблювачів програмного й апаратного забезпечення з'явиться можливість створювати власні розширення Direct, подібно тому, як це можливо у випадку з OpenGL. Це дасть можливість стандартним образом використовувати особливості конкретного (можливо, вузькоспециалізованного) апаратного забезпечення.