這篇白皮書將會比較AlteraFPGA與常見的DSP處理器以及競爭FPGA所能提供的DSP應用效能,由於擁有更高的效能,您將可以更輕易地為您的DSP設計執行分時多工功能,以增加處理通道的數量,降低整體的系統成本。表1顯示了Altera能夠針對DSP提供超越其他矽晶片解決方案的效能優勢。
表1.Altera的DSP效能優勢比較類別
AlteraFPGA相較於DSP處理器
高效能FPGA比較:Altera的StratixIIFPGA相較於Xilinx的Virtex-4FPGA
低成本FPGA:Altera的CycloneIIFPGA相較於Xilinx的Spartan-3FPGA
Altera的效能優勢
每一美元有10倍的DSP處理效能最高可達1.8倍與平均有1.2倍的較高效能最高可達2倍與平均有1.5倍的較高效能
圖1將會比較AlteraStratixII與CycloneII元件各別相較於XilinxVirtex-4與Spartan-3元件的設計效能。
圖1.DSP專用IP與開放核心的比較結果StratixII元件在17個設計中有9個設計的fMAX超過350MHz,且有兩個FIR設計超過400MHz。相較之下,Virtex-4元件在17個設計中僅有2個設計在350MHz以上運作。
CycloneII元件在17個設計中有9個設計的fMAX超過200MHz,且有一個FIR設計超過300MHz,而Spartan-3元件在17個設計中並沒有任何一個能夠在200MHz以上運作。
效能比較法則
有許多種方式可以用來比較不同DSP解決方案的效能,並各自提供不同層次的準確度,以下將有三種方式用來
1
比較DSP的效能。
‧嵌入式乘法器效能:這是比較相對性DSP效能的最簡單方法,不需要去考慮嵌入式乘法器週遭所支援的
架構,以及整體DSP設計的複雜性與效能,不過這也是三種方法中,精確度最差的一種方式。
‧DSPIP評測:這種方式在比較不同矽晶片解決方案的效能上更加精確,因為它會測量許多通常都會整合
到多數DSP設計中常見功能的運作效能,像是有限脈衝回應(FiniteImpulseResponse,FIR)濾波與快速傅利葉轉換(FastFourierTransforms,FFT)便是兩種最常見的DSPIP評測值。
‧應用層級評測:這種模式是當在測量執行特定應用的個別矽晶片解決方案效能時,最精確的一種方式,
例如像是評測來自Berkeley設計科技公司(BDTI)的應用成果。在這篇白皮書中所做的效能比較,使用了DSPIP評測與應用層級評測兩種方法,DSPIP效能的資料是各自比較在Altera的StratixII與CycloneIIFPGA以及Xilinx的Virtex-4與Spartan-3元件中,使用開放式與專屬IP核心後的結果,應用層級評測資料則是依據Altera的第一代StratixFPGA對照常見的DSP處理器在一個真實的DSP系統中運行時所做的比較。
BDTI評測-FPGA與DSP處理器的比較
Berkeley設計科技公司(BDTI)是一家獨立的DSP評測與定期發表分析FPGA在DSP上的應用、比較FPGA與常見DSP處理器效能的領導廠商,最新的評測是依據正交分頻多工(orthogonalfrequencydivisionmultiplexing,OFDM)系統來建行測試,結果呈現出Altera的第一代StratixFPGA相較於其他的DSP處理器,在每個通道上可提供超過95%的成本節省(參見表2)。
表2.BDTI評測比較了StratixFPGA與其他DSP處理器在執行OFDM系統時的結果。DSPA
通道成本(1ku)(1)成本/通道
<0.2~$15~$100
DSPB
~0.7~$210~$300
AlteraStratixEP1S20-6
~20$120~$6
AlteraStratixEP1S80-6
~60$600~$10
表2附注:(1)進行於2005年第二季,其結果來自於DSP應用的FPGA(FPGAsforDSP)與未出版的評測報告。評測結果版權屬於©2005
BDTI。
OFDM接收系統資訊所評測的OFDM接收系統使用的演算法範圍從表格查找到MAC密集轉換,資料大小範圍從4到16位元,此時的資料率範圍是從40到320Mbps,資料包括了實數與複雜值。參見圖2。
圖2.OFDM系統方塊圖輸入與輸出的精度是8位元,這這個設計中的FIR過濾器是一種具備真實係數的127階複雜FIR,且所使用的FFT是一種以正常順序進行輸入與輸出的256點複雜FFT,限符器(Slicer)是一種QAM-256解對應器(demapper),在這個設計中也使用了軟式判斷Viterbi解碼器。
為了得到更高的效能,我們使用了真實的客戶設計來做為評測的依據,Altera的StratixIIFPGA比StratixFPGA
2
提供了平均50%的更高效能。請參見StratixII效能與邏輯效率分析白皮書(StratixIIPerformance&LogicEfficiencyAnalysisWhitePaper)以獲得更多細節。
FPGA與FPGA之間的比較
DSPIP效能評測同時比較了高效能、高密度FPGA與低成本FPGA。
‧高效能、高密度FPGA分析比較的是AlteraStratixIIFPGA與XilinxVirtex-4FPGA。‧低成本FPGA分析比較的是AlteraCycloneIIFPGA與XilinxSpartan-3FPGA。
DSPIP效能評測使用了Altera與Xilinx的專屬IP核心與來自www.opencores.org的開放核心。
評測法則與設定評測FPGA的效能是一件非常複雜的工作,貧乏的評估流程只能夠提供不令人信服與不正確的結果,Altera投入了大量的心力在開發出一套嚴格與符合科學精神的評測法則,已經被業界專家所認可為其是一種在測量FPGA效能上具有意義與精確的方式。關於評測法則的細節,請參考FPGA效能評測法則白皮書(FPGAPerformanceBenchmarkingMethodologyWhitePaper)。表3顯示了評測的設定。
表3.評測設定FPGA類別
高效能FPGA低成本FPGA
FPGA產品系列
AlteraStratixIIXilinxVirtex-4AlteraCycloneIIXilinxSpartan-3速度等級
最快速(-3)最快速(-12)最快速(-6)最快速(-5)
合成工具專屬IP核心
QIS(1),(2)XST(1),(2)QIS(1),(2)XST(1),(2)佈局與佈線工具
開放核心
SynplifyPro8.0SynplifyPro8.0SynplifyPro8.0SynplifyPro8.0QuartusII版本5.0ISE7.1i服務套件1QuartusII版本5.0ISE7.1i服務套件1
表3附註:(1)QIS–QuartusIntegratedSynthesis,XST–XilinxSynthesisTechnology(2)FPGA供應商的合成工具是用於編譯專屬的核心,因為這些核心會產生網表,且工具只負責合成核心的打包工作。
專屬IP與開放核心設計專屬IP核心是由Altera的MegaWizard與Xilinx的COREGenerator工具所產生的核心,在專屬IP核心的比較上,
Altera在所有的九個設計中使用三種型態的常用DSPIP核心:
‧FIR濾波器
‧快速傅利葉轉換(FFT)
‧前向糾錯(ForwardErrorCorrection,FEC)
這些IP核心是利用每家FPGA供應商的工具所產生,且在評測時並沒有進行更進一步的人工最佳化動作。針對開放核心的比較方面,Altera選擇並評測了六種來自www.opencores.org的不同DSP相關開放式IP核心,核心的選擇是依據在這個網站上所標示它的普及狀態超過10%的產品。此外,所選擇的複雜FFT核心是因為它常見於DSP設計之中。
除了一些在原始設計中便是採用FPGA專用的原始程式碼之外,像是,嵌入式記憶體模塊與乘法器的例化,其他所選擇的開放核心都是採用通用的HDL程式碼,以便讓這些採用不同FPGA的設計能夠進行編譯,以便進行公平的比較,在每個設計中的FPGA特定原始程式碼將會被轉換,以便讓這些用於特定FPGA的嵌入式功能可以達到
3
最佳的效能。在FPGA特定的原始程式碼轉換之後,開發核心的評測並沒有做更進一步的人工最佳化動作,以便讓它們能夠儘可能保持它們最原始的狀態。關於專屬IP與開發核心的更多資訊請參見附錄。
高效能FPGA專屬IP與開放核心的比較針對高效能與高密度FPGA,Altera的StratixII產品系列相較於XilinxVirtex-4FPGA,能夠提供高達1.8倍的較高效能,且平均有1.2倍的更高效能,請參見圖3可看到更多相對的效能比較,且在表4中將針對StratixII與Virtex-4產品系列條列出更多細部的效能資料。
現代的FPGA會內建特定的乘法器以增進乘法與累加運算的速度,這已經是許多DSP設計的基本需求,然而,最佳的系統效能不能僅是仰賴於未經處理的乘法器速度,如何利用互補式的邏輯結構以及在相同效能下的佈線架構,來組合這些乘法器才是更為關鍵的事項。
StratixII產品系列無縫式地整合了採用高效能的自適應邏輯模組(adaptivelogicmodules,ALM),以高達450MHz運作的DSP模塊與佈線架構,以便為您的DSP設計提供最快速的系統效能。如同圖1所示,StratixII元件產品系列可在17個設計的9個設計中以超過350MHz的速度運作,且有兩個FIR設計能夠超過400MHz。相較之下,在採用Virtex4元件的17個設計中僅有2個設計能夠超過350MHz,遠低於在Virtex-4規格表中所宣稱的效能。這顯示出只有透過智慧型地結合嵌入式功能與架構,才能夠達到較高的系統效能。
圖3.StratixII相較於Virtex-4的專屬IP與開放核心相對效能比較表4.詳細的StratixII相較於Virtex-4DSP專屬IP與開放核心評測資料DSPIP類型
設計名稱
FIR1FIR2FIR3FIR4FIR5FFT1FFT2
StratixII(MHz)
36837504063683393
Virtex-4(MHz)
306333341322334293370
效能比較
StratixII/Virtex-4
1.201.131.321.261.101.331.06
類型平均值
1.20
採用FPGA嵌入式DSP模塊的FIR濾波器
FFT
1.194
前向糾錯(ForwardErrorCorrection,FEC)
開放核心
ReedSolomonViterbi
AES(Rijndael)
CORDICRadix4複雜FFT(CFFT)簡單FM接收器(FM)
VCS-DCTVCS–Huffman解碼器VCS–Huffman編碼器VGA/LCD控制器
平均值
284229231374340177231276392269196231222366270992372323442461.450.991.041.021.261.780.971.191.141.09
1.201.041.021.261.781.101.091.19
低成本FPGA專屬IP與開放核心的比較Altera的低成本CycloneIIFPGA提供比XilinxSpartan-3產品系列高達2倍的更高效能,以及平均1.5倍的更高效能。依據評測資料,CycloneII元件產品系列在17個設計的9個設計中以超過200MHz的速度運作,且有一個FIR設計能夠超過300MHz。在採用Spartan-3元件的17個設計中並沒有任何一個設計能夠超過200MHz。此外,CycloneIIFPGA在所有的設計評測中都比Spartan-3元件表現出色,針對典型的設計來說,這種效能優勢可以直接解釋成能夠提供更多的通道數量,或是更低的成本。
圖4顯示了在CycloneII與Spartan-3FPGA之間的相對效能比較。表5顯示了CycloneII與Spartan-3FPGA的細部效能資料。
圖4.CycloneII相較於Spartan-3的專屬DSPIP核心的相對效能比較表5.詳細的CycloneII相較於Spartan-3DSP專屬IP與開放核心的評測資料效能比較
DSPIP類型
設計名稱
FIR1FIR2
採用FPGA嵌入式DSP模塊的FIR濾波器
FIR3FIR4FIR5
CycloneII(MHz)
258314208209136
Spartan-3(MHz)
1721861861(1)
CycloneII/Spartan-3
1.501.681.121.36(1)
類型平均值
1.40
5
FFT
前向糾錯(ForwardErrorCorrection,FEC)
FFT1FFT2ReedSolomon
ViterbiAES(Rijndael)
CORDICRadix4複雜FFT簡單FM接收器(FM)
2112061971721472462061081.66183266173
平均值
1441741001091251751555096128178118
1.461.191.971.571.181.401.332.151.721.431.501.16
1.32
1.761.181.401.332.15
開放核心
VCS-DCTVCS–Huffman解碼器VCS–Huffman編碼器VGA/LCD控制器
1.55
1.461.48
表5附註:(1)Spartan-3產品系列在這個設計中無法支援所需的專用乘法器數量。
結論
依據來自BDTI的評測結果與Altera嚴格的評測法則,StratixII與CycloneIIFPGA同時在常見的DSP處理器與競爭的FPGA之間,都能夠取得效能上的優勢。針對DSP應用不能夠僅是簡單地嵌入專用的乘法器便想要能夠達到較高的系統效能,必須像在StratixIIFPGA中的做法一樣,結合高效能的乘法器與能夠相匹配效能的邏輯架構與佈線架構,才能夠達到想要的成果。此外,Altera的QuartusII開發軟體與DSPBuilder提供了在StratixII與CycloneIIFPGA中存取DSP效能的簡易方式,而不需要進行耗時的人工最佳化動作。
‧Altera元件相較於業界最廣泛使用的DSP處理器解決方案,可提供平均達10倍的每一美元DSP處理效
能。‧Altera的高密度StratixIIFPGA相較於Xilinx的Virtex-4產品系列,可提供高達1.8倍與平均達1.2倍的較高
效能。‧Altera的低成本CycloneIIFPGA相較於Xilinx的Spartan-3產品系列,可提供高達2倍與平均達1.5倍的較
高效能。較高的DSP效能可以直接解釋成可以增加分時多工能力,因此可增加在您的系統中可用處理通道的整體數量,以便節省典型設計的成本。Altera提供了全面性的DSP解決方案,搭配了完整的整合式軟體環境、效能最佳化的元件、DSP矽智財(intellectualproperty,IP)核心、開發套件、參考設計與客戶培訓。想知道更多資訊,請參考www.altera.com/dsp。
6
附錄
專屬DSPIP核心資訊
DSPIP類型
設計名稱FIR1
FPGA嵌入式DSP模塊架構的FIR濾
波器Alterav.3.2.1Xilinxv.5.1
FIR2FIR3FIR4FIR5
分接128128128128128
設計描述與AlteraMegaCoreIP參數
時鐘/輸出
11
系數寬度168888
資料寬度
168888
通道11111
系數對稱是是是是是
設計名稱
FFTAlterav.2.1.2Xilinxv.3.1
FFT1FFT2
架構爆發串流
點數10241024
資料精度16位元16位元
旋繞因子16位元16位元
引擎傳輸量
四倍四倍
引擎數量
11
複雜乘法
器標準標準
ReedSolomon解碼
器
Alterav.3.6.0Xilinxv.5.1
設計名稱ReedSolomon
預先設定DVB標準
解碼連續式
關鍵大小一半
位元/符號
8
符號/編碼字204
檢查符號/編碼
字
16
Viterbi解碼器Alterav.4.2.0Xilinxv.5.0
設計名稱Viterbi
架構平行式
軟式寬度
3
約束長度
7
回朔生存路徑
66
DSP開放核心資訊
核心編號AESCORDICFMVGAVCSCFFT
核心名稱AES(Rijndael)CORDIC簡單FM接收器VGA/LCD控制器視訊壓縮系統Radix4複雜FFT
原始網址
www.opencores.org/projects.cgi/web/aes_corewww.opencores.org/projects.cgi/web/cordic/overviewwww.opencores.org/projects.cgi/web/simple_fm_receiverwww.opencores.org/projects.cgi/web/vga_lcdwww.opencores.org/projects.cgi/web/video_systemswww.opencores.org/projects.cgi/web/cfft
參考資料
‧StratixII效能與邏輯效率白皮書(StratixIIPerformance&LogicEfficiencyWhitePaper)‧FPGA效能評測法則白皮書(FPGAPerformanceBenchmarkingMethodologyWhitePaper)‧想了解更多關於StratixIIFPGA效能的更多資訊,請參考Altera網站(www.altera.com/alterazone)
7
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuoyibo.net 版权所有 湘ICP备2023021910号-2
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务