Наверх
Меню
Новости
Статьи
twitter
Новости Hardware
4 мая 2010
2940
  NVIDIA: "Закон Мура мертв"  
 
NVIDIA: "Закон Мура мертв"
Intel и NVIDIA в последний год не стеснялись высказывать свои мнения по поводу будущего процессорных вычислений. Однако недавно вице-президент NVIDIA Билл Дэлли (Bill Dally) в издании Forbes высказался предельно прямолинейно: "Закон Мура мертв". Учитывая, что закон Мура является важной частью бизнеса Intel, подобное заявление выглядит весьма интересно.

Мистер Дэлли не ограничился лишь одной фразой. По его словам, выход из положения лежит в ориентации на параллельные вычисления - что неудивительно, ведь этот путь ведет прямиком к CUDA. Также вице-президент NVIDIA сказал, что двух-, четырех- и шестиядерные процессорные решения неэффективны. Он сравнивает такой подход к "попытке приделать к поезду крылья". Специальные многопоточные решения, разработанные с учетом максимальной мощности и энергоэффективности, смогут вновь обеспечить удвоение производительности каждые два года.

В общем, представитель NVIDIA, как и любой другой человек, вещает "со своей колокольни". В данном случае колокольней выступают CUDA и мощнейшие графические решения на основе Fermi, сложностью организации и производительностью напоминающие центральные процессоры. Так что слова Билла Дэлли стоит принять к сведению. Посмотрим, что на это ответит Intel.


  Автор: Артем Терехов
  Источник: 3dnews.ru
 



Поделиться с друзьями:


Другие новости по теме
 
Вы не авторизованный пользователь. Чтобы воспользоваться всеми возможностями сайта, зарегистрируйтесь.
 

Комментарии

Zhenia 4 мая 2010 21:31
ну хоть признали что что-то у них не работает.


--------------------
Intel "Core i7-950" (3.06ГГц, 4x256КБ+8МБ, EM64T), Noctua "NH-U12P Special Edition SE2", GIGABYTE "GA-X58A-UD3R", 2*3x2ГБ DDR3 SDRAM Kingston "Hyper X" KHX2000C9AD3T1K3/6GX, 2*2048МБ Sapphire "Radeon HD 5970" 21165-00, SSD 60ГБ 2.5" OCZ "Agility 2" OCZSSD2-2AGTE60G, Miditower Cooler Master "Sniper Black Edition" SGC-6000-KXN1-GP, ATX, 950Вт Corsair "TX950W" CMPSU-950TXEU ATX12V V2.3,

AMD Phenom X4 9750 2.4GHz 2Mb+2Mb BOX, Asus AM2+ M3A78-EH AMD780G/SB700, Sapphire ATI Radeon HD4850 512 GDD3, Dimm DDR-II 1024x4 PC8500 Kingstom, Barracuda 120Gb 8mb 7200 WD 400Gb 32mb 7200, CHieftec ATX SG-01 SL ATX, Hiper [HPU-4M530] 530W. G15 and Razer Imperator QcK+
 
 
 

Heg 4 мая 2010 21:35
Кто признал? компания-соперник?
 
 
 

Futurist 4 мая 2010 21:56
Как по мне так реклама CUDA, хотя на мой взгляд закон Мура действительно мертв, ибо увелечение количества транзисторов уже не приводит к большому повышению производительности. Физика не позволяет...


--------------------
Core 2 Duo 8400(~4.3Ghz), ASUSTek P5E, 4x 2048Мб 5-5-5-12 ~1333Mhz, GeForce GTX260 896Mb, 2x 500Gb Saegate ES2.
 
 
 

boroda3 4 мая 2010 23:48
Вообще-то CUDA - вовсе не единственный путь развития параллельных вычислений, более того - это скорее тупиковый путь, как и все закрытые проприетарные решения узкого применения.
Гораздо более интересен в этом смысле OpenCL - примерно то же самое, только открытое, не ограниченное изделиями одной фирмы и позволяющее комбинировать в одной задаче любые сочетания CPU/GPU/акселераторов. (Кому интересно - OpenCL Khronos Group или AMD OpenCL Zone)
Вот только параллельные вычисления отнюдь не везде применимы, к тому же до сих пор практически нет не только готовых оптимизирующих трансляторов для параллельных вычислений, но даже и внятной теории их построения. Что толку от кучи ядер, если распараллеливать задачу надо вручную на уровне искусства?

И вообще, чего так уперлись в этот "закон" Мура? Тем более, что это вовсе и не закон, а просто наблюдение на довольно коротком интервале.


--------------------
Asus M4A78Pro / Phenom X4 955@3.4Ггц + Scithe Mugen-2 / 2x Kingston 2G CL5 PC6400 / AMD HD6850 / 2x WD1003FBYX / Corsair TX650W
 
 
 

Daishi 5 мая 2010 10:05
Цитата: Futurist
хотя на мой взгляд закон Мура действительно мертв, ибо увелечение количества транзисторов уже не приводит к большому повышению производительности

Помнится мне, закон Мура говорил только про транзисторы. Про производительность там ни слова нет.


--------------------
Thermaltake <W0101RE> TR2 550W, MB GA-790XTA-UD4 AMD790X/SB750, OCZ DDR-III 1600MHz 2GB.
Phenom II X3 720=>Phenom II x4 20@3,6GHz, Scythe Mugen 2. Sapphire Radeon HD 3870х2(GDDR3,1GB).
RAID0 2x[WD <1601ABYS> 160Gb+16Mb], Behold TV 409 FM, Miditower 3Q <T001>.
 
 
 

YAHA 5 мая 2010 11:04
Что толку от кучи ядер, если распараллеливать задачу надо вручную на уровне искусства?

Есть ЯП, очень хорошо умеющие параллелиться при минимальных усилиях со стороны программиста. Наиболее яркий представитель — Erlang. В журнале http://fprog.ru/2009/issue2/ есть довольно толковая статья.
 
 
 

ВАНО 5 мая 2010 21:16
Хм... наверно камрад пытался сказать о параллизме, точнее способе организации на 2х и более ядрах/микропроцессоров, находящихся в разных "корпусах":)
А увеличение транзисторов и создание стопятоц ядерных процов всеравно упирается в техпроцесс. Это считай надо ядро увеличить и умудрится разместить("скукожить") на маленькой подложечке кремния. С каждым переходом это всё труднее и труднее, поэтому есть резон делать 2х и более процессорные системы. Аля Скултрейл или АМД V8 :)
PS: Чуть не забыл. Появление новых материалов, то же может сломить закон мура. Или наоборот продлить, например графен :)


--------------------
Будь лоялен к любой платформе!
 
 
 

Futurist 5 мая 2010 23:18
Цитата: Daishi
Помнится мне, закон Мура говорил только про транзисторы. Про производительность там ни слова нет.

Точно это не из этой басни. Но и даже про транзисторы. Скажем вот возмем 233й пень 3й пень 4й там увелечение количества транзисторов приводило к заметному повышению частоты. Сейчас же при несравнимо большем количестве транзисторов частота как отсатеся на уровне максимум 4GHz так и тусуется, а количество транзисторов все растет и растет, только толку то мало взять пень3 и пень4 в сравнение почти двуратное преимущество у 4го пня. Взять нынешние проци уже нет такого преимущества, даже более того, то преимущество что есть, оно мизерно...


--------------------
Core 2 Duo 8400(~4.3Ghz), ASUSTek P5E, 4x 2048Мб 5-5-5-12 ~1333Mhz, GeForce GTX260 896Mb, 2x 500Gb Saegate ES2.
 
 
 

Fiscars 6 мая 2010 09:15
Ну сейчас превосходство кор над пень 4 как раз и будет в 2 раза не говоря уже про "И".


--------------------
AMD AthlonII x4 635@3,35GHz,Asus M4A785TD-V EVO, Asus Triton 88 + 3*R4-L2R-20AC-GP + Zalman FanMate (~900rpm), DDR3 2*2GB Hynix + 2*2GB Crutical, Sparkle GTX460 800/3900 + DeepCool V400 + Nanoxia 1250, Corsair TX650W, original Intant case + 2 Scythe Gentle Typhoon 500rpm IN + 2*120q Floston Red Impeller 1000rpm OUT + 14cm CoolerMaster IN.

Intel E2140@2,8GHz, Samsung 2*2048 PC6400, Zalman 9500AT, Albatron 8800GTS 640, TT Soprano, FSP Bluestorm 500w, Abit Fatal1ty F-I90HD.

Asus K40IN T4200 2.0, 1*2048, G102M, 250 HDD

Samsung WiTU
 
 
 

Suppafly 6 мая 2010 12:47
boroda3,
Вообще-то CUDA - вовсе не единственный путь развития параллельных вычислений, более того - это скорее тупиковый путь, как и все закрытые проприетарные решения узкого применения.
Гораздо более интересен в этом смысле OpenCL - примерно то же самое, только открытое, не ограниченное изделиями одной фирмы и позволяющее комбинировать в одной задаче любые сочетания CPU/GPU/акселераторов. (Кому интересно - OpenCL Khronos Group или AMD OpenCL Zone)
Вот только параллельные вычисления отнюдь не везде применимы, к тому же до сих пор практически нет не только готовых оптимизирующих трансляторов для параллельных вычислений, но даже и внятной теории их построения. Что толку от кучи ядер, если распараллеливать задачу надо вручную на уровне искусства?"

Вопрос в том, насколько хорошие SDK будут доступны для OpenCL. Емнип, уже давно есть плагин для Visual Studio, который позволяет компилировать куски неуправляемого кода для их исполнения на GPU от нВидиа. А уж с разработкой софта у нВ все хорошо, так что вроде бы и компиляторы давно уже есть.

По поводу применения: ну вот на веб-сервере, скажем, можно будет кучу тредов открывать: по треду на пользователя, причем каждый будет на своем ядре выполняться. Отлично распараллеливается обработка потоковых данных. Думаю, знающие товарищи еще кучу примеров эффективного использования MIMD приведут.

Емнип где-то читал, что работа с базами данных (в частности, выборка) неплохо ускоряется GPU.

Плюс ко всему, не забываем, что у видеокарты довольно много очень скоростной памяти на борту. Ясен пень, что узким местом будут шины, но это с текущими интерфейсами. Работы в этом направлении вроде бы идут.


--------------------
Q8300@3.24, 4 GB RAM, HD 5850 Vapor-X, 600W ENHANCE, A4 X750BF, A4 X7 G100, Microsoft KB4000, X-Fi SB730 -> Sennheiser HD 212 Pro, WD 6401AALS
Mobile: ASUS F3-SR, Gsmart G1305
ASUS RT-N10
 
 
 

boroda3 6 мая 2010 20:09
Suppafly, вот как раз SDK от AMD сейчас изучаю - вполне достойная вещь. И тоже на VC навешивается в виде препроцессора.

Но в том и дело, что треды надо явно руками создавать, под MIMD надо специфически затачивать код - опять же руками, под GPU и спецакселераторы тоже много чего руками в явном виде делать надо. Нет транслятора, в котором можно написать обычный линейный код, и который транслятор полностью сам распараллелит и оптимизирует под параллельную обработку. Даже в специально параллельных ЯВУ, начиная от Модулы и кончая всякой экзотикой, все равно надо использовать явные спецификаторы управления параллелизмом - т.е. опять-таки вручную параллелить.

И опять же - далеко не все распараллеливается. БД, мультитредовые приложения, обработка массивов, блочное шифрование - это да, замечательно параллелится.
Но вот, скажем, поточное кодирование не параллелится вообще, потому одномоментно обрабатывается только небольшой кусок данных и обработка зависит от предыдущих результатов. И тут как ни выеживайся, а многоядерность совершенно ничем не поможет.


--------------------
Asus M4A78Pro / Phenom X4 955@3.4Ггц + Scithe Mugen-2 / 2x Kingston 2G CL5 PC6400 / AMD HD6850 / 2x WD1003FBYX / Corsair TX650W
 
 
 

YAHA 7 мая 2010 12:52
Цитата: boroda3
Нет транслятора, в котором можно написать обычный линейный код, и который транслятор полностью сам распараллелит и оптимизирует под параллельную обработку. Даже в специально параллельных ЯВУ, начиная от Модулы и кончая всякой экзотикой, все равно надо использовать явные спецификаторы управления параллелизмом - т.е. опять-таки вручную параллелить.

И как ты себе это представляешь? Транслятор что, через libastral должен догадываться, как потоки взаимодействуют между собой и какие ресурсы им приходится делить?
 
 
 
Добавление комментария
Ваше имя
Ваш Email
Код Включите эту картинку для отображения кода безопасности
обновить код
Введите код