一、导言
国际规范化安排(ISO)在拟定MPEG-1、MPEG-2及MPEG-4的规范根底上,推出了新的规范MPEG-7,该规范的正式名称为“多媒体内容描绘接口”(Multimedia Content Description Interface), 其方针便是发生一种描绘多媒体内容数据的规范,满意实时、非实时以及推-拉运用的需求,它既不同于依据波形和依据紧缩的表明办法如MPEG-1和MPEG-2,又不同于依据方针的表明办法如MPEG-4,而是将对各种不同类型的多媒体信息进行规范化描绘,并将该描绘与所描绘的内容相联络,以完成快速有用的查找。
二、MPEG-7的方针
1.支撑多种音频和视觉的描绘
描绘包含自在文本、n维时空结构、核算信息、客观特点、片面特点、出产特点和组合信息。关于视觉信息,描绘或许包含色彩、视觉方针、纹路、草图、形状、体积、空间联络、运动及变形等。关于音频信息,描绘或许包含腔调、调式、音速、音速改变等。
2.依据信息的笼统层次,供给一种描绘多媒体材料的办法以便表明不同层次的用户对信息的需求。
3.支撑数据办理的灵活性、数据资源的全球化和互操作性。
三、MPEG-7构成要素
MPEG-7的首要元素包含以下几种。
1.描绘东西,包含一组描绘符D(Descriptor )和描绘计划DS (Description Schemes )。描绘符是指用来界说和表达实体某一方面特征的句法或语法。表达实体是由特征标识符(如色彩)和数据类型 (如字符串)等构成的。数据类型可所以“复合”的,既能够由几个数据类型的组合来构成,也能够由数个D来“描绘”一个特征。描绘计划是由一个或多个D和DS构成,DS规矩了它们相互联络的结构和语法。
2.描绘界说言语DDL(Description Definition Language),用来指定描绘计划的一种言语。它是一种模式化言语,是对音视频数据建模效果的一种表征。DDL规矩了MPEG的描绘东西,包含描绘符和描绘计划,并供给了把描绘符构建为描绘计划的规矩。DDL一起也答应界说特别运用中的扩展DS. 描绘东西经过DDL被实例化,并以文本格局(XML)被描绘。
3.用来支撑多路描绘、同步问题、传输机理、文件格局等的体系东西。
四、MPEG-7特点描绘东西
MPEG-7规范供给了一系列的特点描绘东西对特点进行一致的办理,特点描绘东西多用在多于一个媒体被描绘时(如音频和视频)。这些描绘东西依据功用分为内容描绘、内容办理、内容安排、导航和拜访以及运用者交互5类。
1.根本元素(Basic Elements)
根本的数据类型供给了一组对描绘AV(Audio-Visual)内容有协助的扩展的数据类型和数学类型,如矩阵和向量等。根本数据类型一起也能构建衔接媒体文件、定位内容、描绘时刻、地址、人物等。正是这些根本元素经过DS规范构成了界说MPEG-7描绘计划的根底。
2.内容描绘(Content Description)
内容描绘的意图是描绘可察觉信息内容,用以表征可感觉的内容信息。内容描绘包含结构和语义两个方面的内容。结构东西经过区分片断、帧、静态和动态区域来描绘AV内容的时刻及空间方面的结构信息。语义东西经过方针、事情、笼统观念和联络等描绘了和AV内容所反映的实践国际。结构东西和语义东西经过链接一起作用,一起完成了对内容的描绘。
3.内容办理(Content Management) 内容办理用于处理那些与多媒体文档创立、媒体所有权和编码等相关的信息,即那些不能被笼统出来的信息。4.内容安排(Content Organization)内容安排供给一种来描绘多媒体数据的剖析和分类的办法,它能够用来描绘一群方针的特点。
5.导航和拜访(Navigation and Access)
导航和拜访东西被用来界说音频、视频内容的一系列摘要,分化和改换信息,使阅读和获取AV内容愈加便当。它包含概述、分化和改换三部分的内容。
6.运用者交互(User Interaction)
它描绘了用户喜爱以及运用信息等,使对媒体的拜访变得愈加个性化,为用户运用供给了便利。例如,能够依据用户的爱好来界说媒体的优先级,运用户赶快找到最合适的信息。
五、MPEG-7的运用范畴
人们对日常日子中的多媒体信息,要求能高效率地进行拜访、交互操作和显现。这便是MPEG-7 “Pull”(拉)和“Push”(推)的两类运用。这两类运用与社会的政治和经济有着亲近的联络,在教育、影视等专业范畴和消费运用的不同场合都是必不可少的。
1.Pull类型
MPEG-7规范发生的意图是要界说一种规范,使对AV材料的查询变得和现在的文本查询相同便利。虽然其公认的多媒体内容描绘的运用远不止“获取”这一种,但它仍是作为许多原始的MPEG-7运用而保存下来。这些“获取”,即“Pull”类型的运用涉及到数据库、多媒体信息档案以及依据网络的Intenet模型(用户向服务器讨取材料)。
以下是“Pull”类型的一些运用。
(1)商业音乐类运用(卡拉OK和音乐出售)
当用户从电视台看到一首歌,只需唱几段,就可不吃力地从数据库中“查找”出完好的歌曲来;在收取了恰当的费用后,即可把整首乐曲下载到用户的核算机上。
(2)动静作用库
艺术家、动静设计师能够指定一个声效类型,然后从这个声源的很多改变中挑选合适的需求。例如供给一个原型动静,指定细节特征,或许运用拟声,经过哼曲进行“查找”的一种变形办法,来宣布他想要找的那种类型的笼统动静。
(3)前史数据库
人们能够经过一些特定的要害词( “中华人民共和国建立啦!”)、要害事情(WTO)、演讲人(比尔?盖茨)、地址(首都)、日期(2001年9月11日),或许是以上几个方面的恣意组合,来“查找”一个音视频记载或其他相关事情。
(4)经过可回忆的听觉事情进行电影场景“查找”
在人们的回忆国际里,许多的视觉事情是难以忘怀的。最显着的比如便是用特定的“描绘”来指代电影电视场景或对白、音响等,用这样的办法查找到一部电影。
2.Push类型
“Push”与“Pull”类型的运用是相反的,“Push”类型运用更像是播送办法,以及刚呈现的网络播送。“Pull”模型是从索引到“查找”,“Push”模型是从挑选到“过滤”。这两类运用有着彻底不同的要求,一般“Pull”处理的是存储在数据库里的静态信息“描绘”,而“Push”处理的是改变的动态信息“描绘”。“Push”,即“过滤”的要求是供给用户只想收看或收听到的多媒体信息。
如在数字体系中(包含数据播送),MPEG-7描绘能够协助用户挑选节目和各类数据播送信息,用于其时或今后观看,以及记载、存贮。在个性化播送体系的环境中,供给给用户的数据能够依照各自的类型从数据播送中“过滤”出来,而类型的生成可所以主动的(如依据地址、年纪、性别、或曾经的挑选行为等),也可所以半主动的(如依据预设的爱好等)。
六、结束语
MPEG-7的呈现是文本信息时代向多媒体信息时代过渡的必定产品,在未来的多媒体信息检索服务中,MPEG-7必将发挥主导作用。现在,许多研究机构都已开端对其间的要害技术进行研究,并已获得必定效果,但离实践运用还有适当距离。跟着MPEG规范和网络体系的快速开展,MPEG-7的运用也将蓬勃开展,为咱们的学习和日子供给更多的便利。