整合全文检索系统解决方案

  • 格式:doc
  • 大小:919.50 KB
  • 文档页数:18

下载文档原格式

  / 18
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

用友知识管理检索系统解决方案

维思比科技(北京)有限公司

2010年4月20日

目录

(一)现状及总体目标 (1)

1.1、背景介绍 (1)

1.2、现状 (1)

1.3、总体目标 (1)

1.4 总体设计 (2)

1.4.1 系统结构图 (3)

1.4.2信息采集工作原理 (3)

1.4.2.1 数据采集 (3)

1.4.2.2 数据分析 (5)

1.4.2.3 数据写入 (5)

(二)功能及界面设计 (5)

2.1整合搜索 (6)

2.1.1拼音提示.............................................................................. 错误!未定义书签。

2.1.2拼音纠错 (7)

2.1.3 相关推荐 (7)

2.1.4 多维度智能导航 (7)

2.1.5 二次检索 (7)

2.1.6 精确查询与模糊查询 (7)

2.1.7多维度排序 (7)

2.2 硬件配置 (7)

2.7.1 服务器配置 (7)

2.7.2 网络带宽配置 (8)

2.7.3 软件配置 (8)

(三)开发进度安排 (8)

3.1 实施流程 (8)

3.2 实施进度 (8)

(四)投资概算 (9)

4.1 软件产品 (9)

4.2 定制开发 (9)

4.3 培训费用 (9)

4.4 总体预算 (9)

(五)运行维护和培训 (12)

5.1 维护 (10)

5.2 培训 (11)

5.2.1.培训人员 (11)

5.2.2.培训目标 (12)

5.2.3. 培训内容 (12)

5.2.4. 培训方式 (12)

5.2.5. 培训时间 (12)

(六) 附录 (13)

(一)现状及总体目标

1.1、背景介绍

用友软件股份有限公司(以下简称“用友”)成立于1988年,致力于用信息技术推动商业和社会进步,提供具有自主知识产权的企业管理/ERP软件、行业解决方案、服务,是亚太本土最大的管理软件提供商,是中国最大的管理软件、ERP软件、集团管理软件、财政管理软件、人力资源管理软件、财务管理软件,客户关系管理软件及小型企业管理软件提供商。

随着社会的进步,信息技术的发展,一个公司在不断向前发展的过程中会累积相当多的数据,而且随着时间的推移,这些数据累积的越来越快。这些飞速增加的数据一方面为公司积累了一个非常庞大的知识库,成为公司的宝贵财富,而另一方面却产生了一些问题,就是要从这些信息库里查找一些资源越来越费劲,而且这个问题随着数据增加,越来越快的呈现出来。由于这些信息库之间的信息是孤立的,它们之间没有任何联系,随着数据越来越多,查找这些信息耗费的人力物力成本却在不断增加,人们需要在不同的系统之间搜索整理数据,而且搜索的效率越来越低。怎样在多个孤立的数据孤岛里快速找到希望得到的数据,成为一个困扰大家的难题。众所周知,现在是信息社会,谁能在第一时间内掌握一些资料,谁就有可能在第一时间对某些问题做出反应,从而在一些领域取得领先。

1.2、现状

用友软件股份有限公司和各事业单位、各部门之间的内部信息系统很多,像知识管理系统、团队管理系统、PMP、服务支持网站、GBU营销、EBU营销系统等等,关于知识管理系统使用情况的调查可知,当前的知识管理系统有大量的文档、附件,而且这些历史积累的文档知识非常重要,目前这些文档主要分布在各个服务器上,工作人员查找相关信息非常困难。随着公司的发展,各种类型的文件也会越来越多,而且存放在各个不同的系统中,形成了一些信息孤岛。要想查找一些资料,效率非常低,已不能适应具体工作的需要。长期下去,会极大的阻碍公司的发展。整合检索,迫在眉睫。

1.3、总体目标

“整合全文检索系统”主要针对企业中存在的这些信息孤岛,利用先进的技术,把它们整合到一起,高效的生成透明、多维的检索结果,即使有些信息可能是用户本无了解或未能清楚记忆并表达的,并按照最新的互联网体验模式展示给用户。检索结果的动态呈现、多维呈现将会为用户提供发现信息的最佳途径。配合主题词表,即使用户输入错误,系统也能自动推荐正确的表达供用户选择。

总之,整合全文检索系统将帮助网站的终端用户、企业内部用户、管理人员或者其他类型的使用者准确获取信息,成为易于部署、管理方便、使用便捷的信息桥梁。

总体方案如下图所示:

1.4 总体设计

1.4.1 系统的结构图

1.4.2 信息采集工作原理

信息采集工作主要分为三部分,关系库和文件系统数据采集和数据分析、数据写入。

1.4.

2.1 数据采集

数据采集主要通过VSP数据库网关系统(VSP Gateway)来完成。VSP Gateway是面向Oracle、DB2、SQL Server、Sybase、MySQL 等主流关系数据库和Lotus Notes系统的数据交换桥梁,可以整合多种异构数据源,将不同系统的数据实时同步、无缝集成到VSP全文数据库管理系统,协同工作,充分利用VSP全文数据库管理系统的强大检索性能来提供便捷高效的在线检索服务,实现企业级信息资源的统一搜索。

同时,VSP数据库网关系统也支持从政府、企业内部积累的或者正在持续增加的格式文本、XML文件、Excel文件、Access 等文件内提取数据。

VSP数据库网关系统具有以下10个特点:

●易用性

创建采集任务步骤简单,可一次性配置,自定义更新周期,自动定时运行采集任务,无需人工干预。

●实时性

全文数据库与关系数据库的数据实时同步,保证查询结果的准确性。

●安全性

数据采集不改变原有数据库的存储和业务应用,支持身份验证。

●开放性

在数据转化的过程中进行数据的加工和整合。

●支持增量数据

数据采集可以保证持续变化的关系型数据库内的增量数据向全文数据库自动添加。

●支持多个目标监控

通过并发操作,VSP数据库网关系统可以同时监控多个目标数据库。

●直接调用底层接口

VSP数据库网关系统直接调用各种系统的最底层接口,试用简单,配置方便,现有系统不需要增加任何的接口驱动。

●跨平台应用

除微软SQL、Excel、Access产品外,支持跨平台交换其余的数据源所含数据。

●异常状态处理

在数据环境运行异常情况下,可以自动报警,保证业务安全平稳运行。

●支持的版本全面

如上述表格所示,VSP数据库网关系统不仅支持的关系型数据库类型全面,而且支持的版本也丰富,并且可以抽取Lotus Notes系统内数据。