数字出版:实现由ERP向内容管理大幅度跨越
随着数字出版技术的迅猛发展,继ERP之后,与出版行业关系更为密切、也更被出版行业所关注的是CM,即内容管理(Content Management),也叫数字内容管理。
一、内容管理的概念
随着数字出版技术的迅猛发展,继ERP之后,与出版行业关系更为密切、也更被出版行业所关注的是CM,即内容管理(Content Management),也叫数字内容管理。欧盟“Info2000计划”中把内容产业的主体定义为“那些制造、开发、包装和销售信息产品及其服务的产业。”内容产业的范围包括各种媒介上所传播的印刷品内容(报纸、书籍、杂志等),音像电子出版物内容(联机数据库、音像制品、电子游戏等)、影视传播内容 (电视、录像、广播和影院)等。
对于内容管理,目前尚无统一定义。一般认为它包括这样几个方面:网站内容管理、出版(或媒体)内容管理、企业内容管理等。同时,内容管理还广泛应用于数字资产管理(DAM)、电子政务、数字图书馆、企业信息门户(EIP)等。鉴于本文的研究领域,本文所说的内容管理是指出版物的内容管理,也可以称为狭义的“知识管理”。
由于出版物不同与其他产品,出版物具有知识内容,是纯粹的内容产品,因此内容管理在出版业,意味着对产品内容的统一管理。包括对图书、杂志、报纸、音像、电子产品内容的管理。随着跨媒体出版的日益临近,内容管理对出版单位变得尤为重要。今后的出版,肯定要突破单一媒体形式,出版社将演变为内容提供商(Content Providers),对内容一次加工完成,以不同媒体形式出版――纸质媒体、光介质媒体、网络媒体、移动媒体等,这是一个方向,这也就是所谓的跨媒体出版。
因此可以说,内容管理的目的是把非结构化的出版信息,制作成图书、报刊、光盘、网页等产品,供用户以各种媒体形式进行阅读、检索、查询、分析和共享。在这种形式下,传统的读者(Readers)或受众(audience),逐渐演变为内容消费者(Content Consumers) ,因此内容管理解决方案必须为出版社的知识产品提供从原创,到编辑加工,到生产制作,到传输发布,再到阅读消费等的一体化服务。
内容管理不是某种单独技术的创新,而是许多先进技术的综合应用。套用现在流行的用语,就叫“集成创新”。内容管理解决方案重点解决各种非结构化或半结构化的数字资源的采集、管理、利用、传递和增值,并能有机集成到结构化数据的商业智能(BI)环境中,如ERP,CRM等。
二、内容管理的几个关键技术
1.信息检索技术:信息检索技术包括信息的分类、标引、检索、评价、反馈等过程。从历史上看,信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发展阶段。随着互联网的发展,信息检索技术向3W的搜索引擎方向发展。目前很前沿的信息检索技术包括以下几个方面:关键词检索(全文检索)、分类导航检索、同义词(异构词)检索、聚类信息检索、截词检索、精确检索、字段检索、网站超链检索、库间跳转检索、多库同时检索、布尔检索、数字检索、二次检索(多次逼近检索)、自动分词、自然语言检索、定题检索、手机检索等。出版物内容管理面对的是出版单位的大量文稿数据,在文稿的整理入库过程中,必须使用先进的信息检索技术对文稿进行分类、标引、重组,进而建立出版物内容的知识库体系。
2.数据库技术:目前市场上流行的大型数据库产品有:DB2、Informix、SQL Server、Oracle、Sybase、MySql等。有别于小型数据库,大型数据库系统在功能、安全性和扩展性方面提供了更好的解决方案。以Oracle数据库为例,目前的Oracle数据库,在合理规划下, 数据大小理论上可以无限。所谓合理规划包括:数据文件限制与操作系统的文件大小、数据库的表容量、每个表的很大数据量等的设计,具体容量是数据库设计后的计算值。正是因为有了这样成熟的数据库技术,使出版单位的海量文稿信息的异地存储、检索、导入、导出、修改成为可能。
3.数据挖掘技术:数据挖掘(data mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。随着信息技术的高速发展,出版单位积累的数据量急剧增长,如何从海量数据中提取有用知识成为当务之急。在内容管理系统中,出版单位可定制目录或位置,由数据挖掘器自动判断该位置数据内容的变化,根据判断结果自动对新数据进行入库处理。
4.动态集群网络技术(Power-All Networks):对于出版单位所具有的信息存储和跨媒体出版特点来说,传统的服务器设备和网络环境已完全能够满足需求。本文在此仅仅是介绍一种新的更廉价、更集成的硬件技术,即“动态集群网络技术”。所谓动态集群网络技术,就是把整个局域网或多个局域网(每个局域网中的单个和多个硬件)压缩成一个单一的物理部件,由一个物理硬件系统来执行多元动态,形成动态网络。在动态网络中,软件会仿效局域网或多个局域网的单独组件。由于这种动态集群服务器将 Web、Mail、VPN、RADIUS、IDS等多类服务集合于一体,使购买和维护成本大幅下降。这种服务器在存储管理上,可以存储容量超过 1PB(1000TB)的上万亿个文件。
三、编辑流程的数字化
与内容管理密切相关的是编辑流程管理的数字化,包括出版物选题策划的数字化、报刊采编系统的数字化、编务管理的数字化、审批管理(三审、三校、专家外审)的数字化、稿费管理的数字化等。
无论选题策划还是编辑加工,都离不开统一的数字化平台。因此编辑管理的核心是编辑流程的数字化。编辑流程的数字化是指编辑人员在软件中,实现从选题的申报、采编计划的提出,到来稿的登记、编辑加工、校对、审批,再到稿件的发排、发布、生成纸质媒体、光介质媒体、网络媒体,以及稿费的发放等的全业务环节的数字化管理。这其中,包括许多细节的内容,仅以选题申报单为例,其主要字段就包括稿件类型、稿件来源、稿件语种、征订方式、发行渠道、发货方式、目标读者、资助金额、复制数量、成本预算、盈亏预测、建议单价、建议总价、复制数量、装帧设计、着译者简介、预计交稿时间、预计发稿量、预计出版时间等。
在编辑流程管理中,编辑还可以通过主题词标引软件快速对稿件进行标引,这比手工操作,既快捷又准确。
编务管理的数字化,则包括编务人员在软件中对通过的选题进度实时监控,对发稿计划、出版计划、书号分配、样书(样刊、样盘)及稿件档案等进行管理,对稿酬发放、版权合同等进行管理,对编辑工作量进行统计等。
编辑加工数字化后,编辑可以通过软件提供的编辑器和流程管理系统,对稿件进行编辑处理。这包括对原稿的编辑加工,也包括对排好版式的大样文件进行编辑审核和校对。每一流程执行完毕,自动进入下一流程。每位编辑均可直接在稿件上进行修改,撰写审读意见,软件会通过不同颜色的设置来标志不同的审稿级别,并自动记录稿件加工痕迹。已送交审批的稿件,原则上本级不再能对其进行修改。到主编或总编辑终审完毕,可进入到发排、数据库生成、网上发布等环节。
如果是B/S系统的软件,编辑还可以实施远程审稿、远程返修、远程退稿等功能。远程管理完全按权限执行,系统中设置什么级别的权限,编辑就按什么级别的权限处理稿件,如一审、二审、三审等。即使是发排和输出胶片,亦可通过软件的远程功能,将排好的稿件传送到印刷厂,由其输出胶片并照相付印。
出版集团内容管理的技术平台应该是一个专业性很强的高性能数据库管理系统,是构架在功能强大的、高性能的内容管理平台之上的应用系统。其采编平台、加工平台、分销平台等可提供强大的数据采集和加工模块、信息存储及管理模块、信息检索和发布模块等,并且拥有强大的工作流引擎。
四、跨媒体出版
从传统出版传媒业看,其经营的产品一般都是单一媒体,如图书、杂志、报纸、音像、电视等。2000年前的互联网也仅仅是以单一的“第四媒体”形式出现。但今天,数字技术改变了一切。随着内容产业和内容管理战略的实施,跨媒体已成为出版传媒业的大势所趋。所谓跨媒体,即横跨平面媒体(书、报、刊) 、电子音像媒体(CD-ROM,VCD,DVD)、网络媒体(Website)、甚至分销渠道(Distributing channel)等的多媒体、多渠道平台。目前,国际市场上,新闻集团、贝塔斯曼集团、迪斯尼集团等传媒巨鳄均在通过收购、合并等方式向跨媒体进发。国内的TOM集团、中信集团、和讯网等也都在向跨媒体进军。从目前这些跨媒体集团的形成来看,尚处于资本组建阶段,还不能形成统一的将所有业务整合在一起的跨媒体出版平台。为此,国外着名的技术提供商,如Adobe提出了Network Publishing(网络出版)的战略,而Quark则提出了Active Publishing Server(分布式出版)的计划。(编辑:妤婕)
来源:IT商业新闻网