第一届校园通大会    第二届校园通大会   第三届校园通大会  校园之星官方新浪微博    校园之星总经理腾讯微博    加入收藏    设为首页      联系我们
校园之星
客服热线:010-83621612
您当前位置:首页>>AI资源网>>数字出版

出版信息化 ERP之后是内容管理

一、内容管理的概念

  随着数字出版技术的迅猛发展,继ERP之后,与出版行业关系更为密切、也更被出版行业所关注的是CM,即内容管理(Content Management),也叫数字内容管理。欧盟“Info2000计划”中把内容产业的主体定义为“那些制造、开发、包装和销售信息产品及其服务的产业。”内容产业的范围包括各种媒介上所传播的印刷品内容(报纸、书籍、杂志等),音像电子出版物内容(联机数据库、音像制品、电子游戏等)、影视传播内容 (电视、录像、广播和影院)等。

  对于内容管理,目前尚无统一定义。一般认为它包括这样几个方面:网站内容管理、出版(或媒体)内容管理、企业内容管理等。同时,内容管理还广泛应用于数字资产管理(DAM)、电子政务、数字图书馆、企业信息门户(EIP)等。鉴于本文的研究领域,本文所说的内容管理是指出版物的内容管理,也可以称为狭义的“知识管理”。

  由于出版物不同与其他产品,出版物具有知识内容,是纯粹的内容产品,因此内容管理在出版业,意味着对产品内容的统一管理。包括对图书、杂志、报纸、音像、电子产品内容的管理。随着跨媒体出版的日益临近,内容管理对出版单位变得尤为重要。今后的出版,肯定要突破单一媒体形式,出版社将演变为内容提供商(Content Providers),对内容一次加工完成,以不同媒体形式出版――纸质媒体、光介质媒体、网络媒体、移动媒体等,这是一个方向,这也就是所谓的跨媒体出版。

  因此可以说,内容管理的目的是把非结构化的出版信息,制作成图书、报刊、光盘、网页等产品,供用户以各种媒体形式进行阅读、检索、查询、分析和共享。在这种形式下,传统的读者(Readers)或受众(audience),逐渐演变为内容消费者(Content Consumers) ,因此内容管理解决方案必须为出版社的知识产品提供从原创,到编辑加工,到生产制作,到传输发布,再到阅读消费等的一体化服务。

  内容管理不是某种单独技术的创新,而是许多先进技术的综合应用。套用现在流行的用语,就叫“集成创新”。内容管理解决方案重点解决各种非结构化或半结构化的数字资源的采集、管理、利用、传递和增值,并能有机集成到结构化数据的商业智能(BI)环境中,如ERP,CRM等。

 

  二、内容管理的几个关键技术

  1.信息检索技术:信息检索技术包括信息的分类、标引、检索、评价、反馈等过程。从历史上看,信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发展阶段。随着互联网的发展,信息检索技术向3W的搜索引擎方向发展。目前很前沿的信息检索技术包括以下几个方面:关键词检索(全文检索)、分类导航检索、同义词(异构词)检索、聚类信息检索、截词检索、精确检索、字段检索、网站超链检索、库间跳转检索、多库同时检索、布尔检索、数字检索、二次检索(多次逼近检索)、自动分词、自然语言检索、定题检索、手机检索等。出版物内容管理面对的是出版单位的大量文稿数据,在文稿的整理入库过程中,必须使用先进的信息检索技术对文稿进行分类、标引、重组,进而建立出版物内容的知识库体系。

  2.数据库技术:目前市场上流行的大型数据库产品有:DB2、Informix、SQL Server、Oracle、Sybase、MySql等。有别于小型数据库,大型数据库系统在功能、安全性和扩展性方面提供了更好的解决方案。以Oracle数据库为例,目前的Oracle数据库,在合理规划下, 数据大小理论上可以无限。所谓合理规划包括:数据文件限制与操作系统的文件大小、数据库的表容量、每个表的很大数据量等的设计,具体容量是数据库设计后的计算值。正是因为有了这样成熟的数据库技术,使出版单位的海量文稿信息的异地存储、检索、导入、导出、修改成为可能。

  3.数据挖掘技术:数据挖掘(data mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。随着信息技术的高速发展,出版单位积累的数据量急剧增长,如何从海量数据中提取有用知识成为当务之急。在内容管理系统中,出版单位可定制目录或位置,由数据挖掘器自动判断该位置数据内容的变化,根据判断结果自动对新数据进行入库处理。

  4.动态集群网络技术(Power-All Networks):对于出版单位所具有的信息存储和跨媒体出版特点来说,传统的服务器设备和网络环境已完全能够满足需求。本文在此仅仅是介绍一种新的更廉价、更集成的硬件技术,即“动态集群网络技术”。所谓动态集群网络技术,就是把整个局域网或多个局域网(每个局域网中的单个和多个硬件)压缩成一个单一的物理部件,由一个物理硬件系统来执行多元动态,形成动态网络。在动态网络中,软件会仿效局域网或多个局域网的单独组件。由于这种动态集群服务器将 Web、Mail、VPN、RADIUS、IDS等多类服务集合于一体,使购买和维护成本大幅下降。这种服务器在存储管理上,可以存储容量超过 1PB(1000TB)的上万亿个文件。 

版权所有:北京校园之星科技有限公司 | 京公网安备11010602004008号 京B2-20180669 | 工商备案[104492901] | 京ICP备12004309号-4
点击这里给我发消息 点击这里给我发消息