1 导言
在Altera的Nios嵌入式处理器中。用户能够在Nios指令体系中添加用户自定制指令来满意某种特定的运用需求。自定制指令能够拜访存储器或Nios体系外的逻辑资源。增强体系的实时处理才能,特别适用于DSP、数据包处理及对核算密集型软件进行优化。
Altera高功能快速傅立叶改换(FFT)处理器IP核FFT V2.2.0为完结高速FFT算法供给了成功的解决方案,将FFT算法定制为Nios嵌入式处理器的用户指令,用已完结的高功能FFT算法作为Nios嵌入式体系的一个加快模块,使体系能够完结杂乱的数据处理使命。
2 Nios自定制指令的软硬件接口
运用用户自定制指令,用户能够向Nios的ALU和指令体系添加用户自定制功用,完好的用户自定制指令包含用户自定制逻辑和软件宏两部分。
用户自定制逻辑是完结用户操作的硬件部分,Nios最多支撑5个用户自定制逻辑作为ALU的一部分。软件宏供给软件接口,Nios将创立相应C/C++和汇编的宏代码,使得用户能够拜访用户自定制逻辑。Nios自定制指令支撑多种规划文件,主要有Verilog HDL、VHDL、EDIF netlist file、Quartus II Block Design File等。因为用户自定制指令逻辑需求直接连到ALU上.所以Nios供给一套预先界说好称号和功用的接口,如图1所示。Nios装备导游会扫描用户自界说逻辑,查找需求的端口。并把这些端口连到ALU上,这就要求用户自定制逻辑有必要指定所需的端口类型,运用预先界说的端口称号。确保自定制逻辑端口能正确地连到ALU。
当然,Nios也答运用户自定制指令与Nios体系外部的功用模块进行信息沟通。假如装备导游没能辨认用户逻辑模块的某个端口。它将该端口引出到体系模块的顶层.使得外部逻辑能够拜访这些信号,这些端口用export符号。当用户自定制逻辑被集成到Nios处理器的ALU后.能够经过软件拜访用户自定制逻辑,Nios体系中包含5个用户操作码,如表1所示,用户能够经过用C/C++或汇编写的宏来调用这些操作码,经过它们来拜访用户自定制逻辑。
写C/C++代码时,Nios寄存器的运用是通明的,编译器会主动挑选寄存器,而在汇编中则有必要指定寄存器。在添加了用户自定制指令后,Nios装备导游会主动创立相应的宏,支撑对宏进行手艺命名,以进步软件代码的可读性。
在C/C++中经过一个函数调用来拜访用户自界说指令。SOPC Builder主动生成的Nios体系头文件(excalibur.h)里包含了C/C++的宏界说,有两种不同的C/C++宏可供运用,其间前一个运用了prefix端口,后一个没有运用prefix端口。
nm__pfx(prefix,data,datab)
nm_(data,datab)
3 FFT算法完结
FFT算法由Altera的FFT IP核FFT V2.2.0完结,FFT V2.2.0是一个高功能、参数化快速傅立叶改换(FFT)处理器IP核,对Altera StratixII、Stratix GX、Stratix以及Cyclone系列器材进行了规划优化.能够完结改换长度为2m(6≤m≤14)的基-2/4按频率抽取(DIF)的复数FFT算法,IP核运用模块浮点结构可在数据处理过程中坚持最大数据动态规模,以取得最大信噪比SNR与最少逻辑需求之间的平衡。
此处FFT V2.2.0相关参数设置为:改换长度(Transform Length)挑选1024点,数据精度挑选16位,旋转因子精度挑选16位,I/O数据流挑选Streaming方式,复数乘法器结构(Structure)由3个乘法器、5个加法器完结。
图2给出了FFT算法模块的外部端口,I/O接口协议选用Atlantic接口,输入接口为主设备汇端(Master Sink),输出接口为主设备源端(Master Source),Atlantic接口相关内容可查阅文献3,图3为FFT在Modelsim环境下的仿真成果。
4 定制Nios核的FFT指令
运用SOPC Builder体系开发工具树立一个嵌入Nios软核的根本SOPC体系,体系组件如图4所示。明显,用户能够依据实践运用的需求添加其它SOPC体系组件,这儿仅剖析定制FFT算法指令相关内容。
经过自定制指令“Custom Instruction”界面中Import按钮导入规划好的FFT.vhd文件,定制用户指令FFT,这儿运用USR1操作码,如图5所示。
在Nios体系中用户自定制逻辑有必要与指定的端口类型匹配,关于FFT来说,其输入和输出都是实部和虚部为16位的复数,正好能够用一个32位的值来表明 这样FFT.vhd程序的端口(port)能够按如下办法设置:
PORT(
clk:IN STD_ LOGIC;
reset:IN STD_LOGIC;
dataa:IN STD_LOGIC_VECTOR(31 DOWNTO 0);
result:OUT STD_LOGIC_VECTOR(31 DOWNTO 0);
start:IN OUT STD_LOGIC:=0;
clk_en:IN STD LOG%&&&&&%:=0
……
);
行将程序华夏有16位长的data_real_in,data_imag_in,fft_real_out,fft_imag_out端口换成两个32的输入输出端口dataa和result,别的,还有必要加上start和clk_en两个输入端口,尽管这两个端口信号在程序中没有效果。端口例化时再与原有端口对应,如下所示:
data_real_in => dataa(31 downto 16),
data_imag_in => dataa(15 downto 0),
fft_real_out => result(31 downto 16),
fit_imag_out => result(15 downto 0),
FFT其他Atlantic接口信号用export符号,这些端口引出到体系模块的顶层,外部逻辑能够拜访这些信号。
从头生成SOPC体系并更新后得到如图6所示的参加自定制FFT算法指令的Nios处理器,将其全程编译并下载到相应FPGA后,结合Atlantic接口逻辑、FIFO存储器电路,用户即可在C或C++中调用nm_fft指令来完结1024点的高速FFT算法。
5 定论
自定制Nios处理器的用户指令办法,使规划者能够为某种特定的运用定制自己的指令,定制指令的办法在下降软件杂乱性的一起,明显地进步了Nios处理器的功能.协助体系完结杂乱的数据处理。
本文作者立异点:根据IP核FFT V2.2.0完结了改换长度为1024点的高速复数FFT算法,提出了一种新颖的在Nios嵌入式体系中定制用户FFT算法指令的办法,使体系能够完结杂乱的数据处理使命,增强了体系的实时处理才能。
参考文献:
[1]梁曦捷,肖璋.一种根据FPGA的次序迭代FFT规划 微核算机信息,2005,1-2
[2]Altera DataSheet FFT Compiler Megacore Function User Guide 2.2.0 rev1 2005.10
[3]Altera DataSheet Custom instructions for the Nios embedded Processor User Guide ve1.1.2 2002.9
[4]Altera DataSheet Altera Interface Functional Specificmion Ver.3.0 2002.6
[5]潘松 黄继业 曾毓 SOPC技能实用教程[M]北京清华大学出版社2005年3月131-139