close
amd_a10_7700k

Процесорната архитектура Steamroller
x86 блокът на процесорите Kaveri използва архитектурата Steamroller, която трябва да увеличи изчислителната производителност на APU. Оценката на промените е извършена и можем да кажем, че Steamroller скоро ще стане еволюцията на Piledriver, който се използва в чиповете Trinity/Richland. Все още работи двуядрената модулна структура, в която някои части на блоковете са общи за двете ядра. По-специално става дума за декодиращите инструкции и операциите с плаваща запетая. Този подход позволява малко да се опрости общата структура на чипа, но в определени условия, при многопоточно натоварване, подобен модел причинява проблеми в изчислителните блокове.

В Steamroller разработчиците са се постарали частично да решат този проблем, като са разделили декодера с инструкциите на два независими блока за всяко ядро​​. Това е едно от най-кардиналните подобрения в новата структура, която трябва да увеличи производителността на процесора при работата с целочислени изчисления. FPU блокът остава един и за двете ядра на модула, но и тук има направени някои преработки. По-специално е усъвършенстван алгоритъмът на блока за предварително извличане, от 64 KB на 96 KB е увеличен кеша на инструкциите и е оптимизиран целия ред от второстепенни параметри.

Въпреки това, даже за подобни изменения е необходимо значително увеличаване на броя на транзисторите. И това е една от причините, AMD да не бързат с пускането на процесорите, включващи повече от два сдвоени модула.

Steamroller не предлага никакви допълнителни инструкции и в тази връзка, новата архитектура повтаря Piledriver.

Графичната архитектура Graphics Core Next (GCN)
Процесорите Kaveri получиха подобрен графичен блок Radeon R7, който използва най-новата архитектура GCN 1.1, подобна на тази в GPU от семейството Hawaii.

За хибридните процесори на AMD с вграден графичен блок това е нещо много повече от средство за извеждане на изображения върху екрана. Видеоядрото, получило наименованието Spectre, заема 47% от площта на целия кристал. В максималната си конфигурация APU Kaveri могат да съдържат 8 клъстера, включващи общо 512 изчислителни блока. Спомнете си, че за чиповете Trinity/Richland се използва архитектурата VLIW4, а броят на шейдърните процесори не надвишава 384.

За мощната, по стандартите на интегрираните решения, вградена графика, от AMD твърдят, че изчислителната производителност на топ-моделите Kaveri е 856 GFLOPS, 85% от която принадлежи на GPU – 737 GFLOPS.

Графичното ядро ​​също е наследило подобрените блокове за видеообработка. В частност унифицирания видео декодер UVD 4 и подобрения енджин за кодиране VCE 2.

Имайки предвид, че графичното ядро ​​е базирано на архитектурата GCN, хибридният чип автоматично получава поддръжка не само на DirectX 11.2, но и на новото нискостепенно API Mantle, което позволява по-ефективно да се използват ресурсите на GPU. Освен това, новите APU имат и хардуерен DSP-процесор за реализацията на AMD TrueSound. Тази поддръжка обещава възможност за усещането на по-сложните звукови ефекти, които няма да натоварват изчислителния блок.

Концепцията HSA
По-рано изброените функции на новите APU заслужават специално внимание, но в рамките на Kaveri най-накрая са реализирани механизми, които изпълват съдържанието на закачливата дефиниция „хибриден процесор.“ Става дума за технологични решения, необходими за ефимерната концепция HSA (Heterogeneous System Architecture), получила практическо въплъщение.

Поддръжката на технологията hUMA (Heterogeneous Uniform Memory Access) позволява да се реши задачата с достъпа до рознородните изчислителни блокове към едно адресно пространство. В този случай не се изисква разделяне на видео-паметта, която е достъпна в GPU и системната област, с която работят x86-блоковете. Реализацията на hUMA трябва да опрости до голяма степен разработването на приложения и по-специално алгоритмите за включване на всички ресурси на APU.

Другата важна технология, която е приложена в Kaveri – това е hQ (Heterogeneous Queuing). Тя позволява да се увеличи автономността на всички изчислителни блокове. В този случай, GPU получава правото да създава независими потоци за паралелно изпълнение на код, без допълнителен контрол от страна на процесора, както беше по-рано.

Именно поради тази причина, за обозначението на количеството изчислителни ядра (Compute Core), в процесорите Kaveri на AMD се указва общият брой на CPU и GPU блоковете, а не само на x86. В тази връзка, топ-моделът е представен като 12-ядрен APU (4 CPU + 8 GPU).

Въпреки това, само една HSA хардуерна поддръжка е много малко за да се почувстват каквито и да било осезаеми преимущества от такава конфигурация. Необходима е програмна екосистема, а за да се облекчи работата на програмистите трябва да се използва фреймлърка OpenCL 2.0, който беше утвърден през ноември 2013 година. Тук фактически са заложени основите за ефективно използване на хетерогенните изчисления, като използване на общото споделено адресно пространство, работа с разделяема виртуална памет, динамичен паралелизъм и други функции.

Макар и бързото нарастване на приложенията, в които се използват хетерогенни изчисления, то все още не е толкова бързо, колкото бихме искали. Освен това, не всички алгоритми могат ефективно да използват ресурсите на GPU, тъй като в списъкът с приложения, имащи подходящата оптимизация, предимно се появяват пакети за работа с мултимедийни данни. Но сред приложенията, които се използват в ежедневната работа няма толкова много ярки примери.

Процесорите Kaveri
Новите APU са произведени от компанията GlobalFoundries по нормите на 28нм технологичен процес. Производителят може да започне производството на кристали, използващи този технологичен процес, но това всъщност се оказа не толкова лесна задача.

Става дума за това, че поради по-сложната структура и особености на модулната конструкция, Kaveri съдържат 2,41 млрд. транзистора, което е почти два пъти повече от тези в 32-нм APU Richland (1,3 милиарда). Ако вземем предвид, че физическата площ на кристала остава почти непроменена – 245 срещу 246 мм ² – то плътността при монтажа на транзисторите почти се е удвоила.

В началото на продажбите, линията от чипове Kaveri включва три APU. Топ-моделът A10-7850K има базова честота от 3,7 GHz с възможност за ускорение до 4 GHz. Наличието на индекса „К“ в обозначението както вече сме свикнали говори за отключен множител, позволяващ достатъчно лесно да се форсира процесора. Графичният блок включва 8 клъстера с 512 изчислителя, а номиналната честота на GPU е 720 MHz. TDP на чипа е 95 вата.

Моделът A10-7700K също има два сдвоени x86 блока, но базовата честота в случая е намалена до 3,5 GHz, като прагът за динамично ускорение е 3,8 GHz. Броят на изчислителните графични клъстери е сведен до 6, а броя на шейдърни блокове е 384. Освен това, честотата на графичния процесор не се е променила – 720 MHz. TDP за това APU също е в рамките на 95W, а индексът „K“ в името на модела говори, че чипът позволява да бъде клокван.

Третият модел в новата линия – това е четириядрения A8-7600. Любопитното в този чип е, че позволява да му се конфигурира консумацията на електроенергия в зависимост от условията на работа. Ако имате нужда от максимална икономичност, APU може да работи в режим на 3,1/3,3 GHz, а TDP ще е около 45 вата. Ако приоритет за вас обаче е производителността, то процесорът ще работи по формулата 3.3/3.8 GHz, но в този случай TDP ще нарасне до 65 вата. Превключването между режимите ще може да се извършва самостоятелно от потребителя, използвайки съответната опция в BIOS на дънната платка. По принцип, идеята е да се намали консумацията на електроенергия чрез намаляване на тактовата честота – класически пример за даунклокинг, който често се използва от ентусиастите, ако е нужно да се намали нагряването на CPU. Независимо от режима, GPU с 384 изчислителя (както е в A10-7700K) работи на 720 MHz.

Моделът A10-7850K е оценен от производителя на $172, препоръчителната цена за A10-7700K е $ 152, а за моделът A8-7600 цената е $ 119. Ценовата политика на AMD по отношение на новите APU е повод за дискусия. Припомнете си, че топ-чипът от линията Richland се предлага за $ 142. Цената на новия флагман е с 20% по-висока, от тази на предшественика си. Очевидно е, че производителят вярва във високия потенциал на Kaveri, повишавайки горната ценова бариера фактически до нивото на четири-ядрените процесори на Intel.

Платформата Socket FM2+
За работата на хибридните процесори Kaveri е необходима дънна платка с цокъл Socket FM2 +. Подобни модели бяха пуснати в продажба миналата година. Платките са обратно съвместими и ще работят без проблеми и с процесорите Trinity/Richland, но използването на Kaveri в устройствата със Socket FM2 уви не е възможно, поради разликите в електрическите проводници.

За системите от начално ниво, базирани на Socket FM2 + се предлага чипсета AMD A55, който се намира в редиците още на първите хибридни Llano процесори за Socket FM1. Спомнете си, че този чипсет не разполага с вградена поддръжка на USB 3.0 и SATA 6 Gb/s, но при необходимост от такива интерфейси можете да прибегнете до използването на допълнителни контролери. Имайки предвид позиционирането на дънните платки, базирани на този чипсет, това се случва много рядко.

За дънните платки от среден клас се предлага AMD A78. Функционално, това е аналог на A75, което означава, че чипсетът поддържа четири USB 3.0 порта и шест канала SATA 6 Gb/s. Въпреки това, още по-популярния AMD A88X е с контролер за осем SATA 6 Gb/s и възможност за разделяне на процесорните линии PCI Express x8+x8 за CrossFire режима.

Като се има предвид общото позициониране на платформата, цената на най-скъпите модели на базата на AMD A88X е $ 120-140, докато по-голямата част от дъната се предлагат на цена от $ 100. И като цяло, изборът на Socket FM2+ базираните платки е достатъчно голям и подбирането на подходящия вариант не е никакъв проблем.

AMD A10-7850K и A10-7700K
За да се запознаем с възможностите на Kaveri, ние използвахме двата достъпни вече нови модела – A10-7850K и A10-7700K. Процесорите се предлагат в ярки и доста стилни кутии.

В комплекта влиза самият процесор, затворен в прозрачен пластмасов блистер, на който се намира малък стикер с фирменото лого и брошура с кратко ръководство за монтаж. C APU идва и номинална охладителна система.

Охладителят се състои от алуминиев радиатор с доста опростена конструкция, който се обдухва от един 70-мм вентилатор. Общата височина на охладителя е 50 мм. В областта на контакта с процесора още изначално е нанесена необходимата термопаста.

По време на тестовете, ние използвахме дънната платка MSI A88X-G45 Gaming. Според зададения по подразбиране алгоритъм за управление на охладителя, в режим на покой, вентилаторът работеше при 1800 об/мин. При високо натоварване, скоростта му се увеличи до 2900 об/мин, като температурата на процесора се поддържаше на 65 C. Ефективността на този охладител е достатъчна за работа на процесора в нормален режим, но за тези, които възнамеряват на клокват APU просто се нуждаят от по-ефективна алтернатива.

Стоковата версия на A10-7850K се предлага за около $ 185, докато A10-7700K струва около 160 долара. Моделът A8-7600 трябваше да бъде пуснат в продажба през първото тримесечие на тази година, но по време на писането на това ревю, чипът все още не беше достъпен за покупка.

Процесорът A10-7850K е с честотна формула от 3.7/4 GHz, а в режим на покой, скоростта му спада до 1700 MHz.

Графичният блок в максималната си конфигурация съдържа 512 изчислителя, 32 текстурни и 8 растерни блока. Пропускателната способност на паметта е изцяло зависима от честотата на системната RAM. В условията на двуканален режим с чифт модули DDR3-2133 тя е 34 GB/s. Разбира се, за GPU това ниво не е много ниско.

A10-7700K отстъпва на флагмана по тактова честота на x86 ядрата. Двата двуядрени модула работят на 3,5/3,8 GHz. Любопитното в случая е, че без товар, честотата на APU намалява до 2000 MHz, а не до 1700 MHz, както при предишния модел.

Графичното ядро на този процесор включва 6 изчислителни клъстера на 384 шейдъра. Текстурните блокове са намалени до 24, а броят на растерните не се е променил – 8. Честотата на GPU вече е представена от моделите Kaveri и е 720 MHz. Що се касае до пропускателната способност на паметта, то в идентична конфигурация на системата при 128-битова шина, тя е 34 GB/s.

Производителност
За да се оценим възможностите на процесорите Kaveri взехме новите чипове, които са достойни опоненти. На първо място, това е топ-модела от семейството Richland – A10-6800K. Сравнението с APU от предишното поколение се подразбира. Този чип е добър ориентир. Процесорите на Intel в този случай са представлявани от модела Core i5-4440. Един от най-достъпните четириядрени CPU на конкурента, чиято цена е много близка до тази на A10-7850K.

Започвайки със синтетичните тестове, първо ние оценихме работата на подсистемата на паметта и кеша на APU от различните поколения.

Тук трябва да се отбележи, че скоростта за предаване на данни при запис, четене и копиране на данните в RAM при случая с Kaveri леко се повиши, но се увеличи и латентността на паметта с 67 нс до 77 нс. Двойно се увеличи и скоростта на записване и копиране в L1, значително се ускори кеша на паметта от второ ниво, но отново закъсненията станаха малко повече. На практика може да се каже, че тази оптимизация се отрази на резултатите от тестовете.

Първите измервания показват, че APU от предишно поколение няма да се даде на новодошлите и отбеляза предимство от 400MHz, което може в някои случаи да се дължи на архитектурните подобрения. Минималното предимство на A10-6800K над чиповете Kaveri в игровата синтетика и архиватора 7-Zip – още едно доказателство. С видео кодирането обаче, 28-нанометровите чипове се справят по-добре, въпреки съществената разлика в честотите. При рендерите на сцени, Cinebench R15 показва, че грубата сила не е за пренебрегване. 400 MHz са си 400 MHz.

Подобрената работа на целочислените блокове носи много съществено ускорение на APU в тестовете Super Pi и WPrime. Да и с шахматните комбинации в Kaveri стана по-добре, въпреки, че с четириядрения носител от Haswell те все още играят в различни лиги.

След поредицата от етапи, в които APU от различни поколения се сражаваха единствено помежду си, резултатите от тестовете PCMark 8 се превърнаха в приятна изненада. Разбира се, че добрият приръст в производителността при тези GPU е напълно предсказуема, но добрата оптимизация в тестовия пакет под OpenCL скоро надмина очакванията ни.

Тестовете на интегрираните графики – наслада за решенията на AMD. Хибридния чип е със значително по-мощен графичен блок, от този в процесора на Intel, а и в този случай любопитното е с колко новия GPU е по-добър в сравнение с предходното решение, интегрирано в чипа Richland.

В тестовете 3DMark, увеличената производителност е с 26-33%. Въпреки това, дори и вградения в A10-7700K GPU с 384 изчислителя, работещ на 720 MHz, по за предпочитане е интегрираната графика в A10-6800K, съдържаща идентичен брой шейдърни блокове, работещи на 844 MHz.

В реалните игри, много зависи използвания енджин. Като цяло, Kaveri изглеждат за предпочитане, но ситуацията е различна. A10-7850K с 20% изпреварва A10-6800K в Bioshock Infinite, с 36% в Bafflefield 4 и с по-скромните 11% в играта Thief. Между другото, последната позволява активирането на API Mantle. След това, резултатите от устройствата с GCN графиките се подобриха с около 10% (на диаграмите са оказани показателите без Mantle). Изключение от общата картина прави Total War: Rome II, където топмоделът с Radeon R7 успя единствено да се доближи до резултата на A10-6800K.

По време на експериментите, ние оценихме също и влиянието на пропускателната способност на паметта за производителността на графичната подсистема.

Получените резултати – нагледно потвърждават голямата зависимост от работната честота на паметта. Броят на кадрите/с може да се увеличи до 50%, използвайки DDR3-2400 вместо DDR3-1333. В този случай можем да кажем, че комплектът от два модула DDR3-2133 – това е минимумът, който се изисква ако имате намерение да използвате интегрираната графика.

Обобщение
Общото заключение при цялото ни желание да избегнем нееднозначната оценка за новите чипове на AMD е невъзможно. Процесорната архитектура Steamroller наистина е по-ефективна от Piledriver, което позволява често не само да се неутрализира разликата в честотите на двете APU от двете поколения, но в някои случаи Kaveri излизат по-напред. Въпреки това, имайки предвид задачите при високите натоварвания на x86 блоковете, дори и новите процесори е трудно да се конкурират с четириядреника на Intel. В хибридните процесори на AMD е съкратена голямата сила, която може да се освободи, използвайки концепцията HSA. На нас ни остава само да се надяваме, че разработчиците на софтуер все така активно ще се движат към хетерогенната изчислителна техника, имайки предвид, че OpenCL 2.0 позволява значително да се опрости този процес, без да се изискват големи жертвоприношения.

За игровите системи или мощните PC с дискретни графики за предпочитане са чиповете на Intel. Въпреки това, процесорите Kaveri определено заслужават внимание, особено когато става дума за изграждането на универсална система, на чийто собственик интегрираната графика му е напълно достатъчна.

Tags : A10-7700KA10-7850KamdgcnGraphics Core NextHSAKaveriSteamrollerпроцесори