搜索引擎中的查询词自动纠错方法

申请公布号:
CN1755671A
申请号:
CN200410009632.0
申请日期:
2004.09.30
申请公布日期:
2006.04.05
申请人:
北京大学
发明人:
谢欣;李晓明
分类号:
G06F17/30(2006.01)
主分类号:
G06F17/30(2006.01)
代理机构:
北京君尚知识产权代理事务所
代理人:
邵可声
地址:
100871北京市海淀区颐和园路5号
摘要:
本发明公开了一种搜索引擎中的查询词自动纠错方法,包括,建立查询词词库,对查询日志的查询词进行统计,将平均每天查询次数超过阈值的查询词存储于所述查询词词库中;对用户输入的新查询词,首先与所述查询词词库中查询词进行匹配,若完全匹配,则不作处理;若未完全匹配,则查找和该词最近似查询词,若查找成功,则将该查询词词库中的近似查询词返回给用户以校验;若查找失败,则不作处理。在搜索引擎中使用了本发明进行自动纠错后,即使用户不小心输入错误,在很大程度上也能够方便地得到正确查询词的提示,在很大程度上方便了用户的使用。并保证了每次的查准率。
主权项:
1、一种搜索引擎中的查询词自动纠错方法,包括以下步骤,1)建立查询词词库,对查询日志的查询词进行统计,将平均每天查询次数超过阈值的查询词存储于所述查询词词库中;2)对用户输入的新查询词,首先与所述查询词词库中查询词进行匹配,若完全匹配,则不做处理;若未完全匹配,则查找和该词最近似查询词,若查找成功,则将该查询词词库中的近似查询词返回给用户以校验;若查找失败,则不做处理。
专利推荐
移动版 | 电脑版 | 返回顶部