pattern

多模匹配服务

在实际业务开发中可能需要用到一个高性能的匹配服务，用来做关键词过滤等功能。该服务采用 Wu-Manber 多模匹配算法来实现匹配服务，具体的 Wu-Manber 算法实现细节大家没有必要深入研究，感兴趣的可以参考Wu-Manber

使用

编写一个支持 Http 、Memcache 协议通信的匹配服务，匹配的词典存放到文件中，在启动的时候加载，客户端通过 Http 或者 Memcache 协议给定匹配文本进行匹配计算，最终将匹配结果返回

交互数据格式

参数:

{
    "dict": "parrent_dict_name",
    "contents": [
        "近日俄罗斯两名五岁幼童越园了！两人经过预谋，用小铲子挖洞，逃出幼儿园要去买豪车！两人到了豪车展示厅，但是没钱买…一热心市民后将他们送到了警察局",
        "买枪, 卫星电视安装、卫星电视接收器材、电视锅、卫星锅"
    ]
}
// dict ：由于该服务支持多个匹配关键词字典，指定匹配的字典
// contents : 指定要匹配的文本内容

请求返回接口

{
    "code": 200,
    "exposure_id": "1441789531430499",
    "result": [
        {
            "hit": 5,
            "patterns": [
                "买枪",
                "卫星电视安装",
                "卫星电视接收器材",
                "卫星锅",
                "电视锅"
            ]
        },
        {
            "hit": 0,
            "patterns": []
        }
    ]
}

// 如果匹配到了列出匹配到的关键字和匹配到的个数，如果没有则返回空数组

Http 接口
- 接口：/api/pattern
- 请求方式：POST
Memcache 接口
- 使用 get 命令
- key 为请求参数
- 最终 get 返回的数据即为请求返回数据

实现

参考 Adbase 文档快速入门

Name		Name	Last commit message	Last commit date
parent directory ..
conf		conf
rpm		rpm
src		src
test		test
CMakeLists.txt		CMakeLists.txt
README.md		README.md
adbase.ini		adbase.ini
cmake.sh		cmake.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

多模匹配服务

使用

实现

FilesExpand file tree

pattern

Directory actions

More options

Directory actions

More options

Latest commit

History

pattern

Folders and files

parent directory

README.md

多模匹配服务

使用

实现