135 2295 6919
135 2295 6919
公司主站Website:
www.qykh2009.com
电子邮箱:
qykh2009@163.com
公司地址:
北京市朝阳区亚运村天创世缘B2座30整层
Software 软件百科
类别:网站建设访问量:2144编辑:houwenqian 日期:2024-11-01 20:58:00
如果要想判断一个C2C网站的好坏,首先要从系统构架的角度衡量一个搜索系统的高效性和扩展性。通过比较国内外优秀的电子商务网站看出,国内C2C网站的搜索技术与国外的搜索技术有较大的差距。这些差距不仅仅体现在技术细节上,更主要的是C2C网站管理系统系统架构的设计上。
C2C网站的搜索系统分为索引构建和搜索两大部分。索引构建部分介绍了在C2C电子商务网站搜索系统中索引的构建过程。首先使用送料机提取商品信息,将处理过的商品信息送入搜索数据库,然后由一个消息系统将商品更新以消息的形式发送给搜索引擎,搜索引擎建立索引,搜索引擎利用搜索关键字对商品在索引内进行搜索。
和人类不同,计算机不能够理解人类自然语言文档的结构,它们也不认识词语和句子。对于计算机而言,一篇文档只不过是一组0和l的序列。计算机不知道空格可以用来区分一篇文档中的瑚与词。因此,人们必须给计算机编程来区别词与词,这就是所谓的分词。这样的分词程序常称作分词器或者解析器。
在C2C网站系统分词过程中,解析嚣需要知道如何确定这个代表的是一个词,那个代表的是标点,还有一些不能打印的控制符。解析器还要能区分像邮件地址、电话号码和URL等实体。在分词的过程中,还需要存储分词的很多特性,如分词的大小写、语言编码、词性和位置等。
在C2C网站系统数据库中,一个对象代表的是一个数据库实体。用户通过数据库罩面的信息查找到与查询条件相匹配的结果。根据应用的不同,查询结果对象可以是文档、图片或者声音。通常情况下这些文档不是直接存储在C2C网站的搜索系统中,而是存储他们的应用或者原数据库。太多数的C2C网站搜索系统都可以计算出每个结果与查询条件的匹配度,并根据量化的匹配度对结栗对象进行评级,高级别的结果对琢可以显示给用户。如果用户想优化查询,这个查询的过程可能需要多次反复。
再来分析一下C2C网站搜索系统竹后台。C2C网站搜索后台是牲个搜索系统的基础,也是直接影响搜索系统性能的最关键部分。C2C网站搜索后台的大部分功能都是围绕着索引来的,所以可以把C2C网站搜索系统后台再次分为两个部分,即索引子系统和搜索予系统。索引子系统主要是为商品信息建立索引。C2C网站搜索子系统主要是从已有的商品索引中找到满足查询条件的商品。对于C2C网站搜索系统后台来讲,商品的数量是影响系统架构的主要因素之一。原因非常简单,在C2C电子商务网站上,商品的修改非常频繁,索引只能使用内存索引,不能使用磁盘索引。当商品索引的容量大于服务器的内存的时候,商品索引只能分布在多台服务器上。索引的分布式存放比单一存放复杂的多,本文所研究的系统架构是基于分布式索引的系统架构。
【上一条】 没有上一条
【下一条】 没有下一条