前言



多媒体技术是当今信息技术领域发展最快、最活跃的技术,是信息时代的典型代表产物之一,它极大地改变了人们获取信息的传统方法,迎合人们读取信息方式的需求。多媒体技术的迅速发展,使其作为一种信息社会的通用工具,进入了人类社会的各个领域,成为信息交流的关键方式。随着计算机技术与网络的迅速发展,传统的多媒体技术研究方向也在随之改变。从多媒体通信和多媒体制作与表现工具方面,转到了高效存储管理和多媒体信息检索领域,并逐渐向智能多媒体技术方向发展,涉及文字识别、语音识别、自然语言理解、机器翻译、图像识别理解、计算机视觉等方面,其发展潜力不可估量。
海量多媒体数据比传统数据复杂得多,多媒体的信息特征与结构化信息的特征和需求不同,传统的数据库管理系统无法有效处理复杂的多媒体数据,这就要求我们必须使用和研究新的多媒体数据管理和信息检索技术。多媒体数据库是随着多媒体技术发展产生的一种新型数据库,其数据库中的信息不仅包括字符、数字等结构化数据的表达形式,而且包括许多多媒体的非结构化数据,因此数据库管理涉及各种复杂数据对象的处理。多媒体数据库技术的综合性非常强,涉及多媒体数据的数据模型、数据存储与编码、数据索引与过滤、数据检索与查询等方面,随着人工智能技术与应用的蓬勃发展,进一步推动了多媒体数据内容管理和检索技术的发展,对多媒体数据库管理也提出了新的挑战。
目前,多媒体方面的教材和著作大多主要针对多媒体技术本身或面向某种媒体类型,而关于多媒体内容管理和检索的教材很少,且主要集中于文献资料的形式,大多针对某种特定的问题展开基于内容的检索研究。另外,关于多媒体数据库更是缺乏较为完整和系统的介绍。总体来说,关于多媒体数据库技术的研究大都只能依靠查阅相关文献来完成,很难找到合适的教材来全面了解和学习该领域的相关内容。因此,本教材旨在对多媒体数据库技术进行较为全面、综合性的叙述和覆盖,在对多媒体数据库的多媒体数据类型、多媒体数据压缩标准、多媒体数据库等基本知识的介绍基础上,重点讲述多媒体数据压缩技术、音频、静态图像和视频编码标准和方法,以及各类基于多媒体数据内容的检索方法。全书共分为11章: 前6章为多媒体数据内容介绍,着重介绍各类多媒体数据的编码算法,音频信号压缩编码原理和标准,静态图片压缩编码原理和标准,以及视频压缩编码技术和标准; 后5章为多媒体数据库内容介绍,着重讨论多媒体数据库的基础知识,包括体系结构、数据模型等,文本处理与信息检索,基于内容的音频检索,基于内容的图像检索,以及视频索引和检索。
本书适合作为高等院校计算机、广播电视工程专业高年级本科生、研究生的教材,读者通过学习本书可理解和掌握多媒体数据库的理论、设计需求和最新技术进展以及当前有影响的、有代表性的多媒体内容检索系统和商业多媒体数据库系统。此外,本书还适合用于任何想了解多媒体数据管理技术的读者。
在本书的编写过程中,作者得到了许多人的帮助,在此深表谢意。另外,感谢王珂、杨佳峰、高华金同学参与了书稿的编写与校订。
由于作者水平有限,书中难免存在疏漏和不当之处,敬请读者批评指正。
编者2021年3月