Видеочип NVIDIA GF100

Видеочип NVIDIA GF100
Не секрет, что компания NVIDIA по праву считается ведущим производителем графических ускорителей. Стоит заметить, не без «помощи» со стороны соперника – компании AMD, которая долгое время находилась в роли догоняющей. В сентябре 2009 года была анонсирована новая линейка видеочипов AMD Evergreen, причем без какого-либо ответа из стана «зеленых». В сети ходили слухи о скором выходе новинок от NVIDIA, но официальные подтверждения так и не поступали. Лишь под конец года стало известно о весеннем анонсе чипа GF100, основанного на архитектуре NVIDIA Fermi.

Многим покажется странным, что приставка GT сменилась на GF (G – Graphics, F – Fermi). Впрочем, все объяснимо: таким образом производитель хочет показать, что перед нами абсолютно новая архитектура. Действительно, GF100 принес немало архитектурных изменений и инноваций, в большинстве своем касающихся обработки геометрии и распараллеливания вычислений. Но обо всем по порядку.

Сначала о традиционном. Производство GF100 проходит в соответствии с 40-нм нормами; до этого по 40-нм техпроцессу производились лишь младшие решения. Такая политика стала вполне привычна, тем более что в последнее время у компании TSMC возникали проблемы с производством видеочипов по 40-нм нормам. Стоит отметить, что GF100 получил полную поддержку DirectX 11 и Shader Model 5.0. Во многом функции нового API (например, тесселяция) обусловили кардинальные изменения в архитектуре.

Итак, GF100 имеет 4 кластера GPC (Graphics Processing Clusters), каждый из которых состоит из 4 потоковых мультипроцессоров. В свою очередь, каждый из мультипроцессоров содержит 32 потоковых (CUDA) процессора. В итоге мы имеем 512 потоковых процессоров. Для сравнения: у GT200 их было лишь 240. Среди прочего, стоит отметить наличие 4 блоков растеризации, 64 текстурных модуля и 48 блоков ROP. Последние обрели новые методы сжатия, что положительно сказалось на производительности в работе со сглаживанием. Более того, поддерживается новый режим 32x CSAA – до сей поры в действии мы видели лишь 16x CSAA. Стоит отметить, что разницу между режимами можно увидеть невооруженным глазом. Что касается шины памяти, то она состоит из шести 64-битных контроллеров – в целом получаем 384-битное решение. Можно заметить, что шина была урезана в сравнении с таковой у GT200, однако благодаря использованию быстрой GDDR5-памяти пропускная способность лишь выросла. Также GF100 имеет кэш-память второго уровня объемом 768 Кбайт. Кроме того, каждый из мультипроцессоров имеет кэш-память первого уровня и общую память. Первая отвечает за увеличение скорости доступа для команд с неизвестным адресом, а общая память L1 – с известным. Также в арсенале GF100 имеется движок GigaThread, который играет ключевую роль в работе чипа: он распределяет потоки данных на мультипроцессоры.

Как мы уже упоминали чуть выше, улучшение работы с геометрической составляющей стало одним из приоритетных направлений в разработке GF100. В результате чип претерпел некоторые изменения, направленные на полноценную реализацию тесселяции. Сейчас дизайнеры-разработчики вынуждены рисовать несколько моделей с разными уровнями детализации. Тут и возникает проблема: пропускная способность шины ограничивает полет мысли программистов, потому что модели каждый раз заново передаются по интерфейсу PCI Express в GPU. В результате мы зачастую видим «угловатых» персонажей в играх. Использование тесселяции и карт смещения может изменить ситуацию к лучшему. Принцип метода заключается в том, что изначально рисуется несложная модель и отсылается в GPU, где каждый полигон делится на множество фрагментов. К ним, в свою очередь, применяются карты смещения, отвечающие за изменение геометрии вершин. В итоге получается относительно простая и высокодетализированная картинка. В этой связи в состав каждого мультипроцессора было добавлено по четыре PolyMorph Engine. Работа движка включает в себя пять стадий: выборку вершин, их тесселяцию, изменение параметров вершин, установку атрибутов и вывод готового результата. После обработки в PolyMorph Engine следуют три стадии движка растеризации (Raster Engine). Сначала отбрасываются невидимые примитивы, после чего следует очередь растеризации, то есть преобразования геометрической составляющей в пиксели, которые в третьей стадии сортируются по Z-координате. Заметим, что как PolyMorph Engine, так и Raster Engine работают параллельно, что помогает достичь максимально возможного уровня производительности.

Мы рассмотрели основные особенности нового видеочипа NVIDIA. Как вы можете видеть, GF100 имеет много архитектурных изменений в сравнении с GT200, которые помогли сделать значительный шаг вперед в плане производительности и технологических возможностей.
Трассировка лучей

Многие считают, что с приходом метода трассировки лучей (ray tracing) освещение в играх и 3D-приложениях станет еще более реалистичным. Вкратце, трассировка лучей – метод построения изображения, основанный на отслеживании обратной траектории луча от экрана к источнику. Главным его преимуществом является высокий уровень детализации в сравнении с растеризацией. Использование трассировки лучей значительно улучшает качество теней, отражений и эффектов прозрачности. Также заметим, что сам по себе метод достаточно прост в применении. Однако это не значит, что он не требует значительной производительности GPU – как раз наоборот. По сути, GF100 является первым чипом, способным эффективно использовать трассировку лучей в реальном времени. Конечно, говорить про уход растеризации пока рано, но, возможно, в ближайшие годы мы увидим совместное использование двух методов построения картинки.
3D вокруг

На выставке CES 2010 NVIDIA наряду с GF100 представила технологию 3D Vision Surround. Мы помним про подобное решение от компании AMD – Eyefinity, но американцы пошли дальше. 3D Vision Surround предусматривает возможность игры и просмотра видео в 3D-очках при использовании трех мониторов. Задумка, безусловно, интересная, но чересчур дорогая. Кроме 3D-очков, потребуются три монитора с частотой обновления экрана 120 Гц, а также мощная видеоподсистема из нескольких графических чипов. Для гарантированно стабильной работы NVIDIA советует SLI-конфигурацию из двух видеопроцессоров GF100.

Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]