时间:2023-03-21 17:03:35
绪论:在寻找写作灵感吗?爱发表网为您精选了8篇解码技术论文,愿这些内容能够启迪您的思维,激发您的创作热情,欢迎您的阅读与分享!
论文关键词:直读式电子压力计;单芯远距离传输;曼彻斯特码;编码;解码
论文摘要:本文从现有存储式电子压力计的技术现状出发,分析了在井下高温、高压、远距离条件下,实现压力、温度数据实时可靠采集、传输、分析的压力计——直读式电子压力计的数据传输方案和实施,并从技术需求分析、通讯方案选择、单芯远距离传输、曼彻斯特码编解码的软硬件设计等方面,对直读式电子压力计数据传输方案进行了深入研究。试验数据分析结果表明,本文研究结果解决了直读式电子压力计的关键技术,增强了电子压力计在油田测井领域的市场竞争力。
一、引言
目前存储式电子压力计已广泛应用于国内各大油田高温井下压力和温度的测量。存储式电子压力计在工作过程中,仪器内的单片机系统和各种传感器共同完成井下压力和温度的采集,并以数字量形式存储于电可改写型存储器中,待测试过程完成后,再将压力计返回地面,用专门配套研制的数据回放仪与压力计连接,通过软件和硬件接口通讯进行数据的接收、回放和处理,使用很不方便,影响生产。
因此,为克服存储式电子压力计的上述缺点,提高油田生产效率,提升电子压力计在油田测井领域的市场竞争力,必须研制在井下高温、高压、远距离条件下,实现压力、温度数据实时可靠采集、传输、分析的压力计——直读式电子压力计。
二、直读式电子压力计技术需求分析
(一)功能及主要技术指标要求
直读式电子压力计实现井下压力和温度参数的测量,并将测量结果通过单芯铠装电缆实时传送至地面解码控制仪,主要技术指标要求如下所示。
a) 压力测量范围:(0~30、45、60、80)MPa;压力测量误差: 0.04%F.S;
b) 温度测量范围:(-20~+150)℃, 测量误差:±1℃;
c) 传输距离不小于6000m;通讯误码率1.0×10-7。
(二)基本方案及工作原理
直读式电子压力计由井下电子压力计和地面解码控制仪两部分组成,其中井下电子压力计由压力传感器、温度传感器、信号放大电路、模数转换电路、单片机系统、编码电路、数字通讯接口电路和装载于单片机系统中的相关工作软件组成,解码控制仪由解码电路、通讯接口电路、通用计算机(油田配置)和相关工作软件组成。
工作过程中,井下电子压力计由地面解码控制仪通过单芯铠装电缆提供能源,温度和压力传感器分别将环境压力和温度转换为电信号输出,该电信号经放大和模数转换后由单片机系统进行数据实时采集和处理,然后按一定周期经数字通讯口输出。井下电子压力计和井上解码控制仪之间通过单芯铠装电缆连接,解码控制仪中通讯接口电路接收井下电子压力计输出的压力和温度数据,并经解码后输入计算机中进行实时分析和处理。
三、数据传输方案选择
设备之间数据通讯通常有并行通讯和串行通讯两种方案,并行通讯的缺点是传输距离短,通讯信道所占点号多,而串行通讯与之相反。根据井下电子压力计与井上解码控制仪的数据传输特点,需选择串行数据传输方式。
在曼彻斯特编码中,用电压跳变的相位不同来区分逻辑1和逻辑0,即用正的电压跳变表示逻辑0,用负的电压跳变表示逻辑1。
在油田测井中,井下电子压力计在井下采集大量信息,并传送给地面解码控制仪;但井下电子压力计到地面解码控制仪这段信道的传输距离较长且环境恶劣,常用的NRZ码不适合在这样的信道里传输,而且NRZ码含有丰富的直流分量,容易引起滚筒的磁化。曼彻斯特编码方式使得信号以串行脉冲码的调制方式在数据线上传输,和最常用的NRZ码相比,消除了NRZ码的直流成分,具有时钟恢复和更好的抗干扰性能,这使它更适合于从井下到井上的信道传输,因而在井下电子压力计和地面解码控制仪之间选用曼彻斯特编码使数据传输可靠性更高、传输距离更远。
四、曼彻斯特码编码软硬件设计
每一周期井下电子压力计需将采集到的压力和温度两个参数分别进行曼彻斯特编码方式输出,井下电子压力计与地面解码控制仪之间按如下通讯协议进行。
a) 压力与温度均以字为单位进行传送,先发送压力字,后发送温度字,一个压力字和一个温度字的组合称为一个消息;
b) 每一个字由20位组成,第1~3位为3个起始位,第4~19位为16个数据位,第20位为奇偶校验位;
c) 压力字3个起始位电平为先高后低,温度字起始位为先低后高,高低电平均各占一位半,压力字与温度字校验位均采用奇校验;
d) 传输的波特率:5.7292 kbps(175μs/位),传输一个消息共耗时3.5ms。为保证数据传输可靠性,井下电子压力计同一消息在一个采样周期内重复发送两次,地面解码控制仪根据校验位判断每个字的正确性。
由单片机编程输出两路I/O控制信号,经过滤波电路、运放电路、整型电路后,产生曼彻斯特编码双相电平信号,并经单芯铠装电缆送至地面解码控制仪。为满足曼彻斯特编码格式及井下电子压力计与地面解码控制仪之间的通讯协议,井下电子压力计软件采用如下的编程方式输出波形。
a)压力字同步头为262.5μs高电平后跟随262.5μs低电平,温度字同步头为262.5μs低电平后跟随262.5μs高电平;
b)若数据位为逻辑0,则在87.5μs低电平后跟随87.5μs高电平;
c)若数据位为逻辑1,则在87.5μs高电平后跟随87.5μs低电平;
d)校验位的波形产生方式与数据位相同。
五、曼彻斯特码解码软硬件设计
地面解码控制仪需将井下电子压力计输出的曼彻斯特码进行解码,并按通讯协议用软件将接收到的曼彻斯特码数据转换为井下电子压力计测得的压力和温度数据,即地面解码控制仪中的解码过程为井下电子压力计编码过程的逆过程。曼彻斯特码解码过程可分为如下三部分:
a) 同步字头检测,并辨别其为温度数据还是压力数据。
b) 对曼码形式的数据进行解码,从曼彻斯特码波形中分离出同步时钟,并将时钟和数据进行处理使曼码数据转化为非归零二进制数据。
c) 将串行数据转化为并行数据,并进行奇偶校验,以检验数据传输的正确性。
经过几千米铠装电缆传输上来的数据,幅度衰减到毫伏级,因此井上需要精密的解码电路,才能保证数据传输无误码率。井下传输上来的数据经过滤波电路、精密运算放大器、双D触发器输出曼码波形给单片机,经过单片机的程序转化为井下的压力与温度数字量。
六、试验结果
直读式电子压力计首台产品完成厂内试验后,到油田用8000m的铠装电缆连接井下电子压力计和地面解码控制仪,将电子压力计下放到井下6500m的深度,在温度高达150℃、压力为30~60 MPa的油井中测试压力和温度。在三次连续5个小时的测试过程中,数据传输准确可靠,没有出现丢点现象,误码率为零。
七、结束语
试验数据统计分析结果表明,本文研究结果解决了直读式电子压力计通讯方案、通讯协议、单芯远距离传输、曼彻斯特码编解码软硬件设计等关键技术,增强了电子压力计在油田测井领域的市场竞争力。
参考文献
关键词:RGB YCbCr FPGA 色彩空间转换
中图分类号:TN911 文献标识码:A 文章编号:1672-3791(2014)09(a)-0023-01
1 常见色彩空间
我们主要介绍RGB和YCbCr色彩空间。RGB色彩空间是一种常用的色彩空间。它可以实现不同平台的映射而不严重损失颜色信息。任何一种颜色都可以由三基色红、绿、蓝混合叠加而成。RGB三个分量彼此相互独立,三个分量的值越小所代表的亮度越低。RGB色彩空间它所占用的带宽和存储量是很大的,如果使用该色彩空间进行图像传输,非常不利于图像的处理。所以引入另一种色彩空间YCbCr。该格式的色彩空间是演播室编码方案中使用的颜色模型。Y,Cb,Cr分别代表亮度、蓝度分量和红度分量。YCbCr色彩空间有以下优势。首先它的构成原理符合人类的视觉感知过程,再次它可以实现亮度和色度的分离,由于人眼对亮度的变化更敏感,所以我们在传输图像时减小带宽的同时引起的颜色损失小,人眼几乎无法察觉。
2 总体设计方案
系统的总体设计框图如图1所示。
基于FPGA的色彩空间的转换过程可以描述为:首先通过CCD摄像头进行视频图像采集,采集来的RGB图像为NTSC或PAL制式的,接着我们会把视频数据送到解码芯片TVP5150,它会将信号变为ITU-R BT.656格式的数据流。我们选取的TVP5150芯片是和FPGA主控芯片集成在一个开发板上,它的功耗非常低,芯片小巧利于便携。视频解码芯片在对视频信号处理之前总线会对其进行配置。从解码芯片出来的信号便进入FPGA芯片,进行串并转换、解交织等操作最终实现色彩空间的转换。最后信号送到ADV7123芯片进行编码,并通过D/A转换芯片在VGA显示器上显示出来。
3 仿真与硬件验证
硬件部分我们采用了Alera公司的FPGA芯片EP2C8Q208C8N作为核心处理芯片,该芯片内部含有丰富的可编程逻辑资源,可以非常方便的完成相关乘法器的例化。在使用乘法器IPCore时,我们需要进行优化设置。硬件部分包括CCD摄像头、FPGA主控芯片、视频解码芯片TVP5150、视频编码芯片ADV7123等。最终将VGA线和显示器的VGA口相连接,便可以通过显示屏观察结果。
硬件实物图如图2所示。
软件部分采用Quartusii 9.1进行Verilog语言的编写,并进行时序仿真。进行时序仿真的结果图3所示。
4 结语
生活中存在多种色彩空间,它们各自具有不同的特点。但是在很多情况下我们又得在它们之间进行转换,这无论对于科研研究还是消费市场都是很有必要的。本篇论文是通过硬件实现的RGB色彩空间到YCbCr色彩空间的转换,采用的Alera公司的FPGA芯片EP2C8Q208C8N作为核心处理芯片,利用其内部丰富的可编程逻辑资源实现空间的转换,并采用Quartusii 9.1进行软件编程与仿真,验证了模块的功能。
参考文献
[1] 唐晓燕,贾锋,韩磊.基于FPGA的视频颜色空间转换电路设计[J].电子与电脑,2006(8):47-49.
[2] 吴康,刘耀元,胡民山.用FPGA实现色彩空间RGB到YCbCr的转换[J].南昌高专学报,2007,22(6):140-142.
【关键词】MP3;SOPC;Nios II;硬件实现
1.引言
MP3(MPEG Audio Layer3)是高品质的音频压缩标准,因其在音质,复杂度与压缩比的完美折中,占据着广阔的市场,目前在便携式设备领域深受人们喜爱。而随着消费电子的快速发展,MP3在各种场合的需求越来越多,同时针对MP3解码器的设计也越来越多。其中主要有以下三种方式:①以专用MP3编解码芯片为核心加上必要电路的VLSI实现;②DSP处理器加外部存储器,数模转换等器件实现;③以低速核心处理器(CPU/RISC)与其他硬件加速模块的SOPC设计加上器件实现。而第三种实现方式相对于前两种方式在功耗和性价比方面有着明显的优势,本文是基于SOPC技术来实现MP3解码器的设计,其中MP3文件数据用SD卡来存放[1]。
2.MP3解码流程分析
MP3解码流程如图1所示,解码的主要过程包括同步提取码流(以帧为单位)哈夫曼解码,比例因子解码,反量化,重排列,立体声处理,混叠重建,IMDCT变换,子带综合滤波合成,最后输出原始的PCM数据。
在解码过程中,耗时比较多的主要是IMDCT和子带综合滤波这两部分。在编译后它们占据着相当多的硬件资源,功耗特高,所以在设计时针对这两个计算量大的算法IMDCT,子带综合滤波器做了硬件加速处理,来提高整个系统的性能。在IMDCT算法中有长块和短块,计算时长块输入是18点而短块输入是6点,长短块输入的值都是非2的n次方,所以可以采用Szu Wei Lee快速算法,此算法对输入点数越大的运算,其速度提升就越明显。传统的IMDCT算法,在计算长块时需要的是36*18次乘法和36*17的加法,采用Szu Wei Lee算法后,长块的计算只需要43次乘法和115次加法,程序的运算速度显著提高了。在设计子带综合滤波时,直接计算则需要执行32*64次乘法和31*64次加法,两声道采样率为44.1KHz,乘法运算量为(44100/32)*(64*32+512)*2=7056000次/秒,而系统时钟一般都采用的是50MHz,单个周期内占着整个解码时间的58.2%,严重影响了整个系统解码的速率。所以可以根据余弦函数的对称性,并结合Byeong Gi Lee快速DCT算法来进行改进,改进后子带综合滤波则只需要进行384次乘法和376次加法,大大提升了运算速度[2]。
3.系统的硬件设计
基于Nios II的嵌入式系统主要是由三部分组成:IP库(NiosII软核处理器,Avalon总线,设备接口等),GNUPro软件编译器,SOPC Builder开发工具。本文在硬件设计时使用Altera公司的Cyclone II FPGA芯片,型号为EP2C70F896C6,主要设备包括片外SDRAM存储器、SD卡、音频芯片WM8731、LCD等,其中FPGA芯片完成对各个硬件模块和数据流的控制,片外存储器存放程序数据和执行代码,SD卡存放MP3文件,音频芯片将PCM数据流转换输出,LCD显示系统状态,IP核的复用是SOPC设计的关键[3]。其硬件系统结构如图2所示。
而FPGA内部逻辑设计是以Quartus II为开发环境,以Verilog语言编程实现音频控制,SD卡的读写,液晶显示驱动等功能模块的设计。用SOPC Builder配置并产生NiosII软核处理器以及必要的外设,然后在再通过编译,下载到FPGA的配置芯片中,形成硬件逻辑电路的连接,最后验证系统,从而实现MP3音频文件的输出。除了音频模块、SD卡控制模块、LCD显示驱动模块外其他模块都可以通过SOPC Builder来添加IP核构建。
至于MP3解码算法中的子带综合滤波,IMDCT变换两部分处理起来特耗时,针对这类耗时问题,可以采用软硬件协同处理(软件中耗时较多的部分进行硬件加速后,往往会比原先软件处理时的速度快上好几倍。)来提高整个系统运行的时间。通过这种设计方法,在综合时可以确定系统软件和硬件之间的相互制约关系,从而保证系统的确定性,高效性。
4.SOPC片上系统的实现
在FPGA中搭建SOPC系统时,需要用到如下图3所示的软核处理器和Avalon总线结构和外设接口等,其中,系统时钟c0由外部晶振50MHz倍频后得到的,c1为100MHz外设SDRAM时钟,c2为音频芯片提供的18.51MHz工作时钟。timer用于系统内部时间的产生,time_stamp用于记录指令的运行时间。片外SDRAM存储芯片是作为程序存储器及数据存储器。本系统自定义了AUDIO模块,该模块主要用于与WM8731音频芯片数字接口进行数据传输。
5.实现结果
本文是基于SOPC技术实现MP3解码器的设计,其优势在于系统功能改进的灵活性,即不改变硬件平台的情况下,可以随便的对系统进行增删和优化,降低系统的成本,这是其他方案很难比拟的地方。而本设计是在在DE2-70开发板上实现的,硬件解码系统采用Verilog HDL语言进行描述,经过RTL级仿真和验证后,在Cyclone II EP2C70F896C6器件内资源占用率为8%,总的寄存器为3335个,系统频率可达到72MHz,经过实际测试,本设计达到了预期的效果。但还存在着一些地方不够完善和有待改进,这同时也是以后MP3播放器设计需要改进和研究的重点:
(1)本设计功能比较简单,编译后FPGA芯片资源占用的比较少,可进一步增加其它功能,如图像显示。
(2)如何改进更有效的算法,提高系统运行时间,降低功耗,以达到便携式高性能、低功耗的要求,这是未来MP3设计研究的重点。
参考文献
[1]毛丽萍.MP3音频编解码运算中IMDCT算法研究及其FPGA实现[D].[硕士学位论文].华东师范大学,2007.
论文关键词:视频编码,压缩技术
一、引言
所谓视频编码方式就是指通过特定的压缩技术,将某个视频格式的文件转换成另一种视频格式文件的方式。视频压缩发展到现在己有几十年的历史。1948年,Oliver提出了第一个编码理论脉冲编码调制(PulseCodingModulation,简称PCM);同年,Shannon的经典论文“通信的数学原理”首次提出了信息率失真函数的概念;1959年,Shannon进一步确立了码率失真理论;而Berger在1971年所著的《信息率失真理论》一书则对率失真理论做了系统地论述和扩展;以上各项工作奠定了信息编码的理论基础。
二、AVS基本介绍
AVS是基于我国创新技术和部分公开技术的自主标准,技术方案简洁,芯片实现复杂度低,达到了第二代标准的最高水平;而且,AVS通过简洁的一站式许可政策,是开放式制订的国家、国际标准,易于推广;此外,AVS是一套包含系统、视频、音频、媒体版权管理在内的完整标准体系,为数字音视频产业提供更全面的解决方案。综上所述,AVS可称第二代信源标准的上选。
图1AVS视频编码器框图
三、AVS主要技术
AVS采用的主要技术包括:8x8整数变换量化技术、帧内预测、半像素与1/4精度像素插值、特殊的帧间预测运动补偿、二维熵编码、去块效应环内滤波等:
1.整数变换量化:AVS为了避开H.264的专利问题,选择了以往标准广泛采用的8×8变换,这样可以在16位处理器上无失配地实现。AVS采用的64级量化,可以完全适应不同的应用和业务对码率和质量的要求。目前AVS所采用的8x8变换与量化方案大大降低了芯片的实现难度。
2.帧内预测:AVS采用的帧内预测技术,是用相邻块的像素预测当前块,同时采用代表空间域纹理方向的多种预测模式。AVS亮度和色度帧内预测都是以8x8块为单位的。亮度块采用5种预测模式,色度块采用4种预测模式,而这4种模式中有3种和亮度块的预测模式相同。在编码质量相当的前提下,AVS采用较少的预测模式,使方案更加简洁、实现的复杂度大为降低。
3.帧间预测运动补偿:帧间运动补偿编码是混合编码技术框架中最重要的部分之一。AVS标准采用了16×16,16×8,8×16和8×84种用于运动补偿的宏块模式,去除了MPEG-4AVC/H.264标准中的8×4,4×8,4×4的块模式,这样可以更好地刻画物体运动,提高运动搜索的准确性。
4.半像素与1/4精度像素插值:AVS通过4抽头滤波器(-1,5,5,-1)得到半像素点,再通过4抽头滤波器(1,7,7,1)和均值滤波器得到1/4像素点,在不降低性能的情况下减少插值所需要的参考像素点,减小了数据存取带宽需求,这在高分辨率视频压缩应用中是非常有意义的。
5.预测模式:AVS的B帧双向预测使用了直接模式、对称模式和跳跃模式。使用对称模式时,码流只需要传送前向运动矢量,后向运动矢量可由前向运动矢量导出,从而节省后向运动矢量的编码开销;对于直接模式,前块的前、后向运动矢量都是由后向参考图像相应位置块的运动矢量按比例分配导出,因此也可以节省运动矢量的编码开销;跳跃模式的运动矢量导出方法和直接模式的相同,跳跃模式编码块都不编码运动补偿的残差,也不传送运动矢量,即该模式下宏块只需要传输模式信号则可。
6.二维熵编码:AVS熵编码采用自适应变长编码技术。在AVS熵编码过程中,定长码用来编码具有均匀分布的语法元素,指数哥伦布码用以编码可变概率分布的语法元素。采用指数哥伦布码的优势在于:一方面,它的硬件复杂度比较低,可以根据闭合公式解析码字,无需查表;另一方面,它可以根据编码元素的概率分布灵活确定k阶指数哥伦布码编码,如果k选得恰当,编码效率可以逼近信息熵。预测残差的块变换系数后,经扫描形成(level、run)对串,level、run不是独立事件,而存在很强的相关性,在AVS中level、run采用二维联合编码,并根据当前level、run的不同概率分布趋势,自适应改变指数哥伦布码的阶数。
四、总结与展望
目前AVS技术可实现标准清晰度、相当清晰度、低清晰度等不同格式视频的压缩,但针对此类应用的压缩效率还有待不断提高,这应当是AVS视频技术进一步发展的重点所在:着力AVS编解码的实际应用研究,优化AVS运动搜索算法,提高AVS解码速度,从而推动我国数字音视频标准AVS的推广和应用。
参考文献
1 陈亮 AVS先进编码技术研究 华中科技大学 2006
2 申青平 AVS-M关键技术及多平台应用研究 湘潭大学 2007
统计机器翻译在短时期能够得以迅速发展,除了技术进步外,很大一方面要归功于很多开放源码的统计机器翻译工具,有些时候,正是因为这些开放源码的工具才使得某项技术被广泛接受和使用。例如,20世纪90年代初IBM公司的Brown等人提出了5个模型来刻画统计机器翻译,取得了不错的效果,但是在此之后很长一段时间内都没有被大家认可和接受,原因是他们的模型非常复杂,难以理解和实现。直到1999年,开源软件包Egypt的出现,才使得IBM的模型被广泛研究和使用。可以说Brown等人的工作为现代统计机器翻译奠定了深厚的基础,但其影响却是通过开源软件才得以实现,由此可见开源软件对于统计机器翻译这样一个复杂的研究课题的重要性。
1. 首个开源统计机器翻译工具包Egypt
Egypt是在1999年约翰霍普金斯大学统计机器翻译夏季讨论班上,由一些研究人员共同合作开发的统计机器翻译工具包。它包括4个模块;
Whittle: 语料库预处理模块;
GIZA: 用于从句子对齐的双语语料库中训练词语对齐;
Cairo: 词语对齐的可视化工具;
Decoder: 解码器,用来执行具体的翻译过程模块,这一模块没有开放源码。
其中,用于训练词语对齐的模块GIZA现在仍然被广泛使用,利用它能够非常方便地从大规模的双语文本中获得统计知识。GIZA++是GIZA的改进版,GIZA++实现了IBM公司提出的5个模型,其主要思想是利用EM算法对双语语料库进行迭代训练,由句子对齐得到词语对齐。GIZA是独立于语言的,能够对任何两种语言进行训练,这也是统计机器翻译的优点之一。现在几乎所有的统计机器翻译系统都利用这一工具进行词语对齐的训练。
2.语言模型训练工具SRILM
SRILM是一个建立和使用统计语言模型的开源工具包,从1995年开始由SRI 口语技术与研究实验室(SRI Speech Technology and Research Laboratory)开发,现在仍然不断推出新版本,被广泛应用于语音识别、机器翻译等领域。这个工具包包含一组C++类库、一组进行语言模型训练和应用的可执行程序等。利用它可以非常方便地训练和应用语言模型。给定一组连续的词,调用SRILM提供的接口,可以得到这组词出现的概率。
3. 机器翻译的自动评测工具Mteval
在一些著名的统计机器翻译国际评测中普遍使用自动评测与人工评测相结合的方法,例如美国国家技术和标准研究所(NIST)举行的评测。Mteval便是他们开发的自动评测工具,最新版本是mteval-11b.pl,是用Perl语言写成的。
4. 首个基于短语的统计机器翻译系统“法老”(Pharaoh)
“法老”是较早公开的统计机器翻译系统,由美国南加州大学信息科学实验室(Information Science Institute)的菲利普•科恩(Philipp Koehn)在2004年做博士论文期间编写的。“法老”包括两大部分: 训练和解码。训练过程用来从语料库中获得统计知识。它利用了已有的开源软件GIZA++和SRILM,GIZA++用来训练词语对齐,SRILM训练语言模型,但解码没有公开源代码。“法老”原理简单,易于使用,它的出现对于推动机器翻译研究起到了非常大的作用。
5. 中国首个开源的统计机器翻译系统丝路(SilkRoad)
“法老”的出现揭开了统计机器翻译的神秘面纱,然而其核心部分――解码器的源码仍然没有公开。为此,中国的研究人员联合开发了一个完全开放源代码的统计机器翻译系统――“丝路”。该系统由中国的五家研究机构和高校(中科院计算所、中科院自动化所、中科院软件所、厦门大学、哈尔滨工业大学)联合开发,并在2006年中国第二届统计机器翻译研讨会上。“丝路”包括以下模块: 语料预处理及后处理模块“仙人掌”、词语对齐模块“楼兰”、短语抽取模块“胡杨”、以及三个解码器(“骆驼”、“绿洲”和“商队”)。这是第一次将一个完整的统计机器翻译系统公开,极大地促进了国内统计机器翻译的快速发展。
6.摩西(Moses)
“摩西”是“法老”的升级版本,它增加了许多功能,是由英国爱丁堡大学、德国亚琛工业大学等八家单位联合开发的一个基于短语的统计机器翻译系统。来自这些单位的研究人员于2006年在约翰霍普金斯大学召开了一次研讨会,利用6个星期的时间共同开发了这一系统。整个系统用C++语言写成,从训练到解码完全开放源代码,可以运行在Windows平台和Linux平台。
7. 基于句法的统计机器翻译系统GenPar
GenPar工具包实现了一个基于句法的统计机器翻译系统。基于句法的方法将句法结构信息引入到统计机器翻译中来,目前已成为统计机器翻译领域的研究热点。但是构建基于句法的统计机器翻译系统远比构建基于短语的要困难得多,为了让研究者们很快进入这一领域,在JHU2005夏季研讨会上,由纽约大学艾•丹•米拉姆德(I. Dan Melamed)等人组成的统计机器翻译组开发了GenPar。
GenPar的基本原理是利用多文本语法(Multi-Text Grammar)实现多语言的句法分析、结构对齐和翻译。多文本语法是一种多种语言的同步语法,理论上比较完善,功能强大。GenPar有很多特点:首先,该系统是一个纯粹基于句法的模型,在翻译过程中充分利用了句法结构信息; 其次,它具有很好的定制能力,可以实现各种不同类型的基于同步语法的统计机器翻译,很适合于作为实验各种理论的研究平台。总的来看,该系统功能比较强大,但由于其比较复杂,掌握起来比较困难,性能比现有的基于短语的模型稍差。(本文作者米海涛为中科院计算所博士研究生)
链接
统计机器翻译第一人与Google
在统计机器翻译中有一位颇具传奇色彩的人物,就是毕业于德国亚琛工业大学的博士生弗朗茨•约瑟夫•欧赫(Franz Joseph Och)。在1999年他开发出了著名的IBM模型训练工具Giza。在2002年NIST评测中,取得第一名的亚琛工业大学的机器翻译系统也是由他开发的。2002年,欧赫从亚琛工业大学毕业后进入美国南加州大学信息科学研究所(ISI/USC)工作,同时作为Language Weaver公司的顾问,后来于2004年加盟了谷歌(Google)公司。
他所工作的每一个单位都稳拿当年NIST机器翻译评测的第一名。尤其是2005年的NIST评测中,他所在的谷歌公司开发的汉英机器翻译系统取得了0.35的BLEU值,比第二名的南加州大学(即他原来所在的单位)系统的性能提高了近5个百分点。在2006年评测中,除了汉英机器翻译的受限语料项目,其他所有项目的第一名都是谷歌公司。
关键词:H.264,运动估计,整像素预测
1、引言
H.264是一种高性能的视频编解码技术, 它是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT:joint video team)开发的一个新的数字视频编码标准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。论文写作,整像素预测。
作为新一代的视频编码标准,它具有很高的数据压缩比率和优异的性能,广泛应用于视频会议、视频点播、高清视频、移动播放器等多个领域。
H.264最大的优势是具有很高的数据压缩比率,在同等图像质量的条件下,H.264的压缩比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。论文写作,整像素预测。和MPEG-2和MPEG-4ASP等压缩技术相比,H.264压缩技术将大大节省用户的下载时间和数据流量收费。论文写作,整像素预测。尤其值得一提的是,H.264在具有高压缩比的同时还拥有高质量流畅的图像。
在H.264的编码芯片结构中,相比帧内,帧间(Inter Prediction)编码的效率高,但是运算复杂度也比较高。帧间编码的核心运算部分是“ME”(motion estimation)即运动估计,占用最多的逻辑与时钟资源。帧间预测的运动估计过程分为整像素运动估计(IME)和分像素运动估计(FME),首先找到整像素的最佳MV,然后再进行分像素的搜索。除了巨大的计算复杂度,编码过程也很长,包括预测,重构和熵编码。
2、运动估计运算
H.264帧间预测是利用已编码视频帧/场和基于块的运动补偿的预测模式。由于引入了1/4像素精度、多种分割预测等先进技术,在获得更高压缩率的同时,其算法复杂度也大大提高,使得帧间预测编码耗时占到整个编码计算时间的50%以上,若采用全软件实现高清图像的实时编解码,明显力不从心,这就要求使用高性能的硬件编解码器来完成高清实时编解码任务,这也是本人研究的主要内容。
编码宏块(16x16象素)可以分割成不同大小的块像数据,例如16x16、16x8、8x16、8x8、8x4、4x8、4x4等七种模式。而“ME”的再对各种宏块分割方式下的每个块象素进行预测运算,然后由后续模块统计和比较出最优的分割方式。
运动估计包括整像素预测(IME)和分像素预测(IME)两部分,这两部分是串行的。每一个宏块,只有在IME 做完之后,找到最佳整像素MV,再进行FME。
在进行IME计算时,首先要计算MVP,对于一个块象素,预测运算就是在参考帧中搜索出最佳匹配(即两者差异最小)的同尺寸块象素作为当前块的参考区域。如果在整个参考帧的范围下进行全面的搜索,固然可以得到最为匹配的区域,但是复杂度太大。事实上,相邻块在参考帧中的匹配区域一般位置比较接近。综合考虑算法复杂度,编码效果,资源使用等方面,帧间预测做了如下处理:首先根据周边块的Mv值预测出当前块的Mv值,即Mvp,然后在Mvp所指参考帧中象素点周边搜索最佳块象素。
MVP的搜索过程如图2所示,假定E为当前的宏块、宏块分割或者亚宏块分割,除了16x8和8x16,MVP为A、B、C的MV的中值;对于16x8分割,上面部分MVP由A预测,下面部分MVP由B预测;对于8x16分割,左面部分MVP由B预测,右面部分MVP由C预测。论文写作,整像素预测。以MVP作为搜索的起点。
图2 MVP 计算
IME在进行当前宏块MB(x)的MVP计算的时候,前面的宏块MB(x-1)包含分像素的MV还未得到,这个时候我们无法得到准确的A,所以我们此时以MB(x-1)的16x16分割搜索时所得到的整像素MV来代替A,并把据此计算得到的MVP作为搜索的起点。
3、IME模块及功能
IME模块的架构如下图所示
图3 IME模块架构图
IME的主要功能是:
(1)数据:把原始和参考YUV从inter_config模块中取出,为PS和FME模块准备预测所需数据;
(2)控制:控制帧间预测的过程
IME的模块划分及各自功能:
Pipe_ctrl:不同分割间的搜索和选择 将不同分割方式的顺序搜索改为并行,用两条水线来实现加速 Pipe0:进行P16x16,P8x16,P4x8 ;Pipe1:进行P8x8,P16x8,P8x4,4x4由两条共同完成(为了减少pipe0的等待时间,把pipe1的部分工作放到pipe0中)
MVp_ctrl:每种分割的具体搜索过程
(1)计算MVp值
(2)控制reg_ctrl模块的数据存取
Reg_ctrl:为相连模块准备数据
(1)为整像素准备数据,传输给PS模块;
(2)为分像素搜索准备数据,传输给FME模块;
(3)为重构准备数据,传输给FME模块
4、与IME模块相关的主要功能模块
图3中与IME工作相关的有两个主要的部分,一个是Inter_config 模块,还有一个是PS模块,它们在系统中起着重要的作用。论文写作,整像素预测。
1. Inter_config模块及功能描述
Inter_config模块,即帧间数据调度模块,其数据传送如图4所示,Inter_config模块有两部分功能:一是为IME服务,把IME所需的数据从DDR取到Sram;二是为Loop Filter服务,把LoopFilter模块的deblock运算所需要的一部分数据从DDR取到Sram以及将deblock运算后的宏块数据存入DDR。
图4 Inter_config模块数据传送
Inter_config模块与IME有关的工作包括:
1)取原始YUV数据,Luma部分直接拉给IME_Reg_o,Chroma部分存入Sram0。
2)为IME准备计算所需的9个宏块的Luma数据,并存入Sram0和Sram1。
3)将这9个宏块的Chroma数据准备到Sram1中,用于Chroma资料拼接之用。
4)接收到IME_ChromaStart_i信号有效后,开始FME运算所需Chroma数据的相关准备工作。包括:①从Sram0中取Chroma的原始YUV送给IME;②从Sram0中取Chroma3x3Mb数据并进行拼接(将每个block对应的2x2像素,向右向下扩展,变成3x3像素)后送给IME。论文写作,整像素预测。
5)把最后一行的5个mv(当前Mb最后一行的block的4个mv及右侧相邻的1个mv)存入Sram0,作为下一宏块行进行Mvp预测所需数据。
2. PS模块功能描述
PS模块,即预测选择模块,本模块主要用于选择当前编码宏块的最佳预测方式,帧内预测还是帧间预测;若是帧间预测还需给出宏块的最佳分割以及分割的最佳MV,除此之外,还需求残差值,用于后面的重建。其主要功能如下:
1)接收IME模块的整像素亮度值,以进行整像素搜索,找出最佳的整像素MV;
2)将两套流水线所得出的cost进行比较,选出最佳partition;
3)接收inter_ctrl模块中IME模块的亚像素亮度值,以进行亚像素搜索,找出最佳的亚像素MV以及cost,并与最佳的整像素MV的cost相比较,选择最佳的MV;
4)将选出的最佳的cost与intra_ctrl中的最佳的cost,比较得出最佳的预测方式,帧间还是帧内;
5)若选出的是帧内,则结束当前宏块的帧间操作,准备下一个宏块的帧间操作;若选出的是帧间,则接收IME或FME的亮度和色度值,进行求残差操作,送给DCT以备后面重建。
5、总结及展望
本文对帧间编码中IME运算所需数据进行探讨和分析,并提出一套架构设计方案,时序和资源使用都比较优化。设计方案在空间上具有较高的并行度,处理能力高,非常适合实现高清视频编码。目前市场上对于H.264的研究开发一般都是基于PC或者DSP解决,很少有基于硬件实现的开发,功能上还不足以实现高清实时信号的编码和解码。本设计能够实现帧间预测的关键部分,在后续的研究中如果能使用H.264标准在帧间预测所带来的高压缩率,如果能将其带来的复杂度的增加限制在可容忍的范围内,支持帧间预测的高清实时视频编解码的芯片实现是非常有意义的,应用前景很广阔。
参考文献
[1]新一代视频压缩编码标准——H.264/AVC 毕厚杰 人民邮电出版社
[2]Iain E.G.Richardson.H.264 and MPEG-4 Video Compression: VideoCoding for Next Generation Multimedia. U.S: Wiley Press, 2003.
[3]Tung-Chien Chen, Chung-JrLian, and Liang-Gee Chen. Hardware Architecture Design of an H.264/AVC VideoCodec. Asia and South Pacific Conference on. Design Automation, 2006.
[4]Renxiang Li, Bing Zeng, and Ming L. Liou. A new three-stepsearch algorithm for block motion estimation. IEEE Trans.Circuits Syst.Video Technol., vol. 4, No. 4,Aug 1994
论文关键词:RFID,医药品,物流,信息系统
引言
近些年来,频频出现的医药品安全事故使公众对医药品生产工艺和用药安全产生了不同程度的质疑。部分事故就是由于现在医药品物流系统的不完善所导致的。为此,商务部将出台《医药物流企业分级评估指标》、《医药物流服务规范》、《药品零售企业经营服务规范》和《药品现代物流企业标准》等针对医药物流企业的一系列行业标准。可见,改善医药品物流信息系统,提高其服务水平,增强医药品监管、维护正常的药品市场秩序,成为当务之急。
1 RFID的基本概念
Radio Frequency Identification(RFID)即无线射频识别,是利用电磁感应、无线电波或者是微波等信号通过空间耦合进行非接触式的双向通信信息系统,通过这种形式的数据交换从而达到识别目标的一种技术,俗称电子标签。[1]
由于具有可非接触式数据交换、有效读写距离远、读写速度快、可识别高速运动的物品、数据记忆容量大、安全保密性高、读写穿透力强、可重复使用、耐恶劣环境能力强等一系列优点,因此RFID主要用于军事、航空、交通、物流、制造、汽车、零售、医疗、动物、食品、票证、服装、图书、煤矿、防伪等广泛领域中的自动识别和数据采集。
RFID的初次使用可追溯到上世纪六十年代电子商品防盗系统(Electronic Article Surveillance,EAS)中的比特电子标签。从七十年代开始,RFID技术及产品进入到快速发展的时期,如RFID技术逐渐融入到动物追踪识别系统以及电子车牌系统。RFID技术及产品进入到商业应用阶段是从八十年代开始,此后各种规模的RFID系统开始出现,RFID技术及产品逐渐成为人们生活的一部分,RFID技术标准化问题也日趋得到重视论文服务。自本世纪初开始,RFID技术开始向物流与供应链领域渗透。[8]
一个完整的RFID系统应当由RFID数据采集器、中间件或接口、应用系统软件以及信息管理平台构成;其中数据采集器内包含标签、芯片、阅读器以及天线,这其中的芯片主要用于数据交换时的储存。正是由于芯片的这一独特之处,使得RFID与传统的条形码技术有所区别。[9]
整个RFID系统的工作原理如图1所示:RFID系统工作时必须有个前提,就是要处于一定的有效磁场区域内。带有信息的电子标签进入到有效磁场区域内,当阅读器通过天线发送出一定频率的射频查询信号,这时电子标签凭借感应电流获得的能量而被激活,将存储在芯片的信息经自身解码后通过内置天线发送出去。阅读器的接收天线接收到信号后,传送给到阅读器。接下来信息系统,阅读器对接收到的信号进行解调解码,解码后的信息通过应用系统软件最终输送到信息管理平台进行相应处理和控制。[2]
图1 RFID系统工作原理图
2 医药品物流系统分析
医药品物流是在依托一定的物流设备、技术和物流管理信息系统的基础上,有效整合营销渠道上下游资源,优化医药品供、销、配、运等环节中的验收、存储、分拣、配送等作业过程,通过自动化、信息化和效益化等技术的应用,从而提高订单处理能力,减少货物分拣差错,降低库存及缩短配送时间,进一步降低
物流成本,提高物流服务水平和资金使用效益。典型的医药品物流过程如图2所示:[3]
图2 医药品物流过程
2009年,国务院出台了《物流业调整和振兴规划》,医药品物流的发展是其中的主要任务之一。由于医药品自身的一些特性,医药品物流系统相比较于其他物流系统而言,对于逆向物流的管理更为重要。
2.1医药品物流复杂性高
医药品行业是一个集高投入、高技术、高风险与高回报等特点于一身的行业。医药品物流最大的特点就是分类复杂、品种繁多。医药品行业分类如表1所示:
表1 医药品行业分类
序号
标志值
类型
1.
按照自身性质分
化学原料药、化学药品、医疗器械、化学试剂以及保健品等
2
按照来源和性状
中药材、中药饮片、中成药,化学原料药及其制剂、抗生素类、生化药品、血清疫苗、血液制品,放射性药品等
3
按照温度分
常温品种、低温品种、冷冻品种等
4
按中国药品管理制度分
处方药和非处方药
5
编解码技术。多媒体通信的一个显著特点就是要传输的信息量非常大,尤其是视频数据,其编解码技术在较大程度上影响着业务的质量。IPTV采用了先进高效的视频压缩编码技术,使得视频流在800Kb/s的有限带宽上接近DVD(MPEG2)的视觉效果(DVD的视频传输带宽通常为3Mb/s)。目前主要编解码技术是MPEG4、H.264与AVS三种。MPEG系列是重要的视频编码标准,所有的视频编码技术都参照了MPEG技术。H.264是新一代视频编码标准,H.264的压缩率是MPEG-2的2倍以上,是MPEG-4的1.5至2倍,这样超高的压缩率是以牺牲编码运算量为代价的,但其解码的运算量涨幅较小,比较容易实现用户接收播放。AVS是中国拥有自主知识产权的第二代信源编码标准音视频编码技术标准,是高清晰度数字电视、宽带网络流媒体、移动多媒体通信、激光视盘等数字音视频产业群的基础性标准。
流媒体传送技术。对于传送IPTV音视频数据流而言,流媒体传送技术极其重要,先进的技术可以节约系统带宽、减轻系统负担、优化系统。流媒体传送系统主要设备是中心/边缘流媒体服务器与存储分发网络。流媒体服务器具有较高的稳定性,支持多个并发流和直播流的需求,而存储分发网络由多个服务器组成,通过负载均衡(如CDN)来大规模组网。CDN网络除了提高用户响应速度之外,还有一个更为重要的作用,就是减轻巨大的数据流量对骨干网的压力。
数字版权管理(Digital Rights Management,DRM)。它是保护多媒体内容免受未经授权的播放和复制的一种方法,为内容提供者提供视频、音乐、彩铃、论文、图片等数字数据免受非法复制和使用保护的一种手段。数字多媒体内容是IPTV中最为关键的节目来源。有了DRM技术,可使各个平台(无论是因特网、流媒体还是交互数字电视)的内容提供商们放心地提供更多的内容,采取更灵活的节目销售方式,同时有效地保护知识产权。
IP机顶盒技术。IPTV系统的接收端包括计算机、电视机与手机。由于电视机本身并没有存储功能,不支持软件安装,也无法像手机那样加装流媒体支持功能,因而无法实现IP的支持功能,必须加装一个IP数据流转换成电视机可以接收的信号的机顶盒才能收看IPTV节目。机顶盒应具备数据转换、接入支持、协议支持、业务支持、解码支持等功能。
在广电系统数字电视平移模式中,杭州模式对IPTV技术的应用最为成功。杭州数字电视模式实质上就是用以太网接入,只是最后一段线路即楼道交换机到户内终端使用的是同轴电缆,它成功地将IPTV技术和广电的数字电视进行了结合。现在,其他省市的广电系统已经在以杭州模式为示范建设自己的广电网络。江西省的情况和杭州的实际情况有差别,不具有发展IPTV业务的优势平台,所以我们不能停留于模仿层面,而应该在总结先行者的经验中,寻找更好的在广电网络中运用IPTV技术的方法。
一、数字电视平移是广电网络追求效益的增长点。IPTV能够提供多种形式的内容服务,传输电视节目只是其功能应用的一部分,它还可以提供其他的电视类业务、通信类业务和各种增值业务,满足我们的各种需求。
二、增加多种形式的内容服务要求更宽的带宽来进行传输,IPTV采用的编码和压缩技术是最新的高效视频压缩技术,它压缩了数据,节约了带宽。同时IPTV可以在传输的过程中把视频内容按IP协议封装成数据包,能根据用户不同的需要,灵活解决网络传输的问题。如果用户的频带宽,就可以压缩率低一些,传的包多一些,质量好一点;如果用户对节目的清晰度没有太高的要求,可以采用压缩率高一些,传的包少一些。这也解决了江西省现有SDH网络带宽不足、无法继续添加业务的问题。
三、真正实现互动是IPTV最重要的一个优势。IPTV不仅能满足受众观看节目的个性化需求,而且能让受众参与到电视节目中来,与电视台一起完成节目。