企查查历史版本(企查查实时更新)

六八 182 0

企查查历史版本(企查查实时更新) 第1张

企查查历史版本(企查查实时更新) 第2张

第一集文本是企比比搜寻财务主管范兆明撷取的Elasticsearch在企比比的应用领域课堂教学撷取人:企比比搜寻财务主管范兆不可否认,企比比是一家专精做税务查阅的公司,所有的业务出口处都是如前所述查阅顺利完成的,能说查阅是同时实现企比比价值的主要就出口处。

因此,第一集文本将介绍Elasticsearch在企比比的应用领域课堂教学企比比碰到阿里云ES时的状况是,海量统计数据的统计数据难以储存,储存后的统计数据难以做大规模的预测,动态的使用者行为不能获得到监视如前所述这些关键点,让企比比在寻找解决之道的过程中碰到并认识了阿里云ES。

透过构筑ELK笔记预测网络平台、笔记预测、概要检索等功能,充份的了解和熟识了ESES主要就的技术升级和特征,归纳而言有三个:构架与生俱来分布式系统、检索概要和内部结构、预测动态裂解构架与生俱来分布式系统ES与生俱来的分布式系统构架能透过硬体提速的方式同时实现海量统计数据统计数据的收缩,并且它的复本商业模式能解决统计信息安全问题。

企查查历史版本(企查查实时更新) 第3张

检索概要和内部结构透过Lucene的征迁检索、Bm25的概要检索和高效率的内部形式化检索,能满足绝大部分搜寻情景预测动态裂解动态的海量统计数据裂解潜能和多裂解商业模式能顺利完成绝大部分预测情景如前所述以上ES的潜能,最后企比比优先选择了阿里云ES。

那么阿里云在ES的基础上又带来了四方面的快捷呢?

企查查历史版本(企查查实时更新) 第4张

杰出的NLP不定式器阿里云ES具有杰出的NLP不定式器潜能目前非主流的ES英文不定式器有IK和ANSJ等主要就的三种,企比比优先选择了IK和ANSJ后,冲洗了大约一百万级的基础统计数据,然后复制到IK和ANSJ透过阿里云不定式器对照了IK和ANSJ不定式器发现,如前所述NLP的阿里云不定式器更杰出。

差别就在于,如前所述NLP的阿里云不定式器能在相同情景导出出相同的语法,顺利完成相同不定式,因此企比比最后的软件系统是,以阿里云不定式器为主,以ANSJ不定式器且以做了三套不定式商业模式,同时应用领域于文件格式搜寻服务平台管理和高效率扩充。

这两个特征原先就是云网络平台的纯天然优势,这也是为什么小企业和高速路发展企业会优先选择云网络平台的根本原因。企比比如前所述阿里云Elasticsearch设计的应用领域课堂教学,这里给大家介绍几个核心的统计数据。

企查查历史版本(企查查实时更新) 第5张

5000+QPS5000+QPS是指动态峰值QPS达到每秒5000;200+应用领域200+是指目前有200个统计数据维度参与了动态搜寻;8TB统计数据8TB是指所有动态搜寻统计数据加起来超过8TB从下图企比比的发展历程能发现,2014年企比比只有单一的工伤搜寻维度;发展到2020年底,企比比已经超过了200多个搜寻维度。

快速的版迭代、统计数据爆炸式的增长、爆炸式的使用者请求等等都在阿里云ES上都得到了很好的体现因为阿里云具有足够稳定、快速提速、大大减少运营成本和搜寻故障等特征,在这些年的发展中不断的提升企比比的搜寻体验

企查查历史版本(企查查实时更新) 第6张

企比比的技术特征企比比涉及到的其他技术特征跟概要检索特征是一样的,包括高并发、海量统计数据统计数据、动态裂解和不定式等特征高并发和动态裂解也是ES所擅长的,再加上阿里云杰出的NLP不定式器,两两作用后让企比比搜寻体验更杰出。

企查查历史版本(企查查实时更新) 第7张

搜寻的目的我们越来越重视搜寻并不断提高搜寻体验,那么搜寻需要呈现的结果是怎样的呢?

企查查历史版本(企查查实时更新) 第8张

第一个是精准搜寻顾名思义,就是把搜寻词和文本词完全匹配的结果返回给使用者;第二个是不定式匹配不定式匹配是目前搜寻技术的非主流,也是最难同时实现的难度在于,虽然有如前所述语法的不定式器,如如前所述NLP的阿里云,但仍然会有不定式异常和不定式歧义的时候。

基础统计数据的权重配比、冲洗排序能否达到使用者预期和搜寻意图,都是长期迭代的任务第三个是意义搜寻意思是当使用者搜寻的词,在精准搜寻和不定式搜寻都没有匹配,但实际上意义是一样时提供的服务,比如番茄和西红柿,或是同音字和形近字,这个时候就会需要意义搜寻。

意义搜寻就是把同义字、同音字和形近字都反馈给搜寻使用者第四个是意图搜寻当使用者搜了一大段文本,但是在不定式、精准和意义搜寻里都没有办法找到搜寻结果时,就需要提取使用者搜寻的核心词, 然后用核心词再去搜寻并反馈给使用者结果。

第五个是部分匹配搜寻意思是当上述四个搜寻都没有结果的时候,需要将部分匹配出的结果反馈给使用者Elasticsearch还能带来什么?目前ES在机器学习方面做了持续迭代,能自动发现动态统计数据异常,自动同时实现业务的动态监视。

ES能做更深层次的统计数据预测,还能将发现统计数据的核心词和统计数据的特征推荐给搜寻的使用者。本文为阿里云原创文本,未经允许不得转载。

发表评论 (已有0条评论)

还木有评论哦,快来抢沙发吧~

先修复后付款18703823046