Transcodifica Video

Recensione - Test della piattaforma AMD Brazos con APU Zacate Fusion, il modello E-350.

Avatar di Tom's Hardware

a cura di Tom's Hardware

Transcodifica Video

A essere onesti la riproduzione video non è probabilmente ciò che viene in mente quando s'immagina un chip con CPU e GPU su un singolo die. Solitamente si ricercano soluzioni capaci di mostrare i punti di forza di entrambi i mondi - un tempo separati - che lavorano insieme su operazioni parallelizzate. La transcodifica video sarebbe perfetta.

Sfortunatamente Intel ha tolto il vento in poppa ad AMD con l'introduzione di Quick Sync (Intel Sandy Bridge: la seconda generazione di CPU Core), progettato specificatamene per accelerare codifica e decodifica. Disponibile sui processori Sandy Bridge mobile a bassa tensione con consumi che scendono fino a 17 W, questa funzionalità non viene offerta gratuitamente - il modello meno costoso, il Core i5 2537M ha un prezzo di 250 dollari. 

Tuttavia le sue prestazioni con questo tipo di carichi di lavoro sono competitive. Di contro le piattaforme Brazos dovrebbero trovarsi a meno di 500 dollari per l'intero netbook/nettop. Le schede madre con chip E-350 saldato dovrebbero essere vendute per meno di 100 dollari. Confrontare Zacate con Sandy Bridge non è leale.

Il compromesso che s'incontra passando a un design più economico è la minore aggressività nell'accelerazione della transcodifica. La pipeline di transcodifica contempla la lettura di un file in entrata, la sua decodifica, la codifica e la presentazione del risultato finale. 

La APU Zacate di AMD è in grado di accelerare lo stato di decodifica, ed è in grado di avvantaggiarsi delle presenza di CPU e GPU sullo stesso die per velocizzare il processo di copia dei dati dalla memoria grafica al processore. AMD presenta questa caratteristica con il nome Fast Copy Optimization.

Il modo in cui lavora è semplice. In precedenza le applicazioni di transcodifica usavano istruzioni della CPU per copiare i dati video decodificati da una scheda video attraverso il bus PCI Express al processore, dove avvenivano le operazioni di codifica e post-processing. 

Questa interazione tra spazi di memoria non simili bruciava cicli di lavoro della CPU. Sui processori desktop moderni, probabilmente non sarebbe stato un collo di bottiglia eccessivamente debilitante. In un'implementazione maggiormente mobile, però, bruciare cicli non solo frena la prestazioni in modo più evidente, ma ha anche un impatto negativo sui consumi. Il Fast Copy facilita  l'accesso di memoria diretto (DMA), la copia dello stesso dato senza usare cicli della CPU, liberando i due core Bobcat per il lavoro sulla codifica.

La codifica avviene quindi nel processore? Perché non usare gli 80 stream processor all'interno di un paio di engine SIMD allo stesso modo in cui Intel coinvolge le EU nell'accelerazione della codifica su Sandy Bridge? AMD consente di accelerare la codifica sulle schede video dedicate, ma nel caso di Zacate i due engine SIMD non sono abbastanza potenti da mostrare miglioramenti apprezzabili. Questa funzionalità sarà disponibile sulla piattaforma Sabine, che avrà il proprio cuore nell'APU Llano, quindi dovremo attendere diversi mesi prima di vedere se AMD sarà all'altezza di Intel.

Nel frattempo ArcSoft sta lavorando sul proprio codificatore OpenCL che potrebbe - o forse no - cambiare le prestazioni di Brazos in tal senso nel breve periodo. CyberLink imboccherà la strada dell'OpenCL nel corso dell'anno. Entrambe le aziende sono impegnate maggiormente su Llano, che avrà una GPU abbastanza potente da gestire le operazioni di codifica.