加入收藏 | 设为首页 | 会员中心 | 我要投稿 天瑞地安资讯网 (https://www.52baoding.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

企业级搜索如何更好落地?

发布时间:2022-11-28 16:21:12 所属栏目:大数据 来源:
导读:   信息时代飞速发展,企业信息化普及的速度也越来越快,各种应用系统越发的完善。在信息化建设的脚步不断前行的同时,企业内部的信息资源膨胀也越发严重。随之而来的便是对信息资源查找的成本成倍上升,效率降低。
   信息时代飞速发展,企业信息化普及的速度也越来越快,各种应用系统越发的完善。在信息化建设的脚步不断前行的同时,企业内部的信息资源膨胀也越发严重。随之而来的便是对信息资源查找的成本成倍上升,效率降低。那么如何在保证信息安全的情况下,完成快速高效的定位和查询,也就变成了我们企业级搜索所要解决的主要问题。
 
  一、企业级搜索是什么
 
  说到搜索,我们很容易联想到google、百度、搜狗、bing等一些主流的互联网搜索引擎。这些搜索主要都是通过网络爬取到的一些互联网上的信息内容,用户会根据自己的需求,输入一些关键信息来查询自己想要得到的信息。
 
  企业级搜索,相对来说大家平时的关注度还是没有那么高。那什么是企业级搜索呢?顾名思义,所谓企业级搜索,是用户搜索习惯在组织中的延伸,是一种随着搜索引擎的普及和习惯养成后逐渐形成的一种基于组织的搜索需求,是在组织内整合获取工作所需信息的需求。包括企业、网络媒体、政府机关、教育科研等,属于搜索引擎的高级应用。企业用户对信息的需求也不仅仅限于简单的查询结果,而是结合搜索、数据库查询、语义句法分析、分类和聚类、相关性分析等技术,整合现有的信息资源,提炼出具有商业价值的或社会价值的数据支持。
 
  36大数据 36大数据_大数据搜索_大数据之路阿里巴巴大数据实践
 
  二、互联网搜索与企业级搜索有什么区别与联系
 
  1、从搜索的数据层面上
 
  首先从获取数据的来源看:互联网搜索的数据主要来源于网络爬虫的数据采集。而企业级搜索的数据来源主要是通过企业内部的主动产生。那么,由此所带来的数据更新时间上的差异也就产生了。相对来说,互联网搜索依靠爬虫爬取到新的内容,从产生到获取到还是需要一定时间的。而从企业级搜索的角度来说,新数据的产生都是可以及时感知到的,所以相对来说,数据从产生到获取的时间可以几乎达到实时。
 
  2、从搜索排序层面上
 
  从互联网搜索的排序来看,主要都是基于网页排名(pagerank)的算法来进行排序的。
 
  Pagerank源于google,主要用来衡量特定的网页相对于搜索引擎中其他网页而言的重要程度,它实现了将链接价值概念作为排名因素。此外还有一些其他的算法,例如hilltop,trustrank等。相对来说互联网搜索会基于网页结果的重要程度进行排序,而相对来说企业级搜索的结果在满足匹配程度的基础上,并不像互联网搜索那样关注结果之间的联系,更多的来源于企业内部的业务逻辑。
 
  3、从搜索结果层面上
 
  对于互联网搜索来说,由于某些相关性,或者无法覆盖所有数据等多种原因,用户在进行结果搜索时没有想要的结果也会对此予以理解。但对于企业级搜索来讲,发过哪些文档,邮件等等。具体发生过的事情,如果通过相应的检索逻辑,却无法得到相应的检索内容,用户是无法接受的。
 
  4、从搜索权限上
 
  相对来说,互联网搜索的面向的用户没有明确的权限划分,即使有政治因素影响,对结果的搜索过滤也是全局的。而对于企业级搜索来说大数据搜索,往往企业内部有严格的权限控制,对于不同级别的用户搜索到的结果是截然不同的。
 
  三、企业级搜索的价值
 
  现有组织中经过多年的运营和积累,存储了海量的信息资源。由于某些历史的原因,这些海量的信息资源管理分数,共享困难。据调查统计,人们有大概有60%的时间花在不同信息的搜索上,而仅有40%的时间用在创造价值的工作上。那么做好企业级搜索的价值和意义也就显而易见了。
 
  36大数据 36大数据_大数据之路阿里巴巴大数据实践_大数据搜索
 
  1、推动数据的结构化存储,规范化企业资产的积累
 
  随着大数据时代的到来,对企业内部的数据价值的重视程度也越来越高。现在企业内部有80%的数据都属于非结构化数据。实际上并不是所有数据都能直接对我们产生价值。能够直接产生价值的,可以直接用来分析的其实只是企业内部的结构化数据。类似于文件、音频、邮件等这样的非结构化信息数据是很难被我们直接使用的,除20%以数据库的形式进行存储外,其余部分则散落在计算机系统中的各个角落。
 
  而随着我们企业搜索的建设,大量的数据和信息会按照需要进行结构化处理。不仅可以提升我们检索的效率,另一方面也在一定程度上完成了我们对现有信息数据的结构化。让累积的数据真正从非结构化的数据变成可以用来分析的数据资产。
 
  2、提高价值产出,提升搜索效率
 
  对于不同的企业和组织来说,规模越大,涉及到的业务系统也就越多。那么对于数量日渐庞大的业务系统,以及数量众多的企业员工来说,搜索效率的提升所带来的收益还是非常可观的。通过企业级搜索,打通各个业务系统的壁垒,可以让企业搜索的效率进一步得到提升。虽然针对不同的企业,搜索效果的提升带来的效率变化以及成本的节约会有所不同,但总体来说,系统数量越庞大,使用人数越多,对企业内部搜索效率的提升就越多。每个人每次搜索提升30%的效率,对于整个企业来说,也是一个不小的收益。
 
  大数据搜索_大数据之路阿里巴巴大数据实践_36大数据 36大数据
 
  四、企业级搜索如何落地
 
  要做一个好的企业级搜索项目,有两个条件是必不可少的。首先要保证的是大方向上不能错,其次是技术上要过关。那么下面我们也将从这两个方面来进行分析如何将一个企业级搜索成功落地。
 
  1、方向如何保证
 
  1.1、确定好目标
 
  有很多的时候,我们发现客户更清楚的是自己的“愿景",而不是具体的目标。那么我们需求阶段要做的就是把所谓的客户愿景变成可分步、可落地、可衡量的具体目标。那项目过程中,我们该如何制定我们的具体目标?
 
  一个好的目标制定,会帮助我们更好的解决问题。通常情况下暴露出来的更多是问题,就比如在大多数企业需求调研过程中,我们听到的最多的就是“希望搜索反应速度能变快”、“搜索的效率可以提高”,“可以精准的获得结果”。好的目标制定一定要做到可衡量。比如:“在XX数据量下XX并发下可以在秒级(1秒左右)出结果”,“用户搜索的每日平均时长降低50%”,“用户每日搜索请求检索的平均次数降低1/3”。明确化的目标,方便实施过程中更好的落地,也知道了相对具体标准的差距,优化也就有了方向。
 
  1.2 确定好阶段
 
  有了明确的目标制定,接下来需要做的是在合理的范围内进行目标的排期。让目标真正做到量化,可执行。阶段性的目标不仅可以作为我们阶段性成果的检验,另一方面也可以让我们在接下来的过程中更好的修正方向。一般来说,企业级搜索涉及到的系统数量可能有很多,我们一般会建议只对其中的一个或者几个系统进行企业级搜索的接入。往往我们发现,部分企业其实对企业级搜索没有明确的概念,调研过程中也很难明确的知道自己要的是什么,反而在做完一个阶段后,就会发现自己对目标有了新的理解,也更明确了自己要什么。那么在后面做的时候就可以更好的落地,形成一个正向的结果偏移。
 
  1.3 持续完善
 
  对企业级搜索来说,当完成了一次从0到1的跨越后,其实还远没有结束。目标的完成并不意味着终结,反而是一个新的开始。第一步,我们完成了角色权限,数据的上报等。让用户可以通过企业级搜索平台来完成各种搜索请求。除此之外我们还有很多可以优化的空间。比如:
 
  1.3.1 结合语义搜索
 
  搜索过程中,我们可以基于对搜索词语的语义分析理解,让我们更加接近用户想要找到的内容。通过对搜索词的记录,结果的点击、收藏等行为进行搜索结果的调权,让排序的结果更优。对于不同部门的人员、角色、职级等也可以通过对行为的记录来使得不同用户得到不同的效果(搜索推荐)。
 
  36大数据 36大数据_大数据之路阿里巴巴大数据实践_大数据搜索
 
  1.3.2 完善特定搜索
 
  对于搜索的结果我们也可以进行进一步分类,比如针对搜索的特定词语,例如:“出差”,“请假”,“手册”,“文档”,等进行结果展示的优化,进一步提升搜索交互体验。例如搜索“出差”,“请假”可以直接在结果页面进行流程的填写,“手册”,“文档”等可以在页面直接进行查看。由此,根据对用户搜索行为的分析,可以进一步提升搜索体验以及工作效率。
 
 
 

(编辑:天瑞地安资讯网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!