Skip to content

词库存在包含关系的词组时,分词只按长词组生效,被包含词组不生效 #82

@Limaoda

Description

@Limaoda

例如词库中有这两个词组:深圳科技、深圳科技有限公司

深圳科技 用 jieba_search 分词后:深圳科技 用 jieba_index 分词后:深圳、科技、深圳科技

深圳科技有限公司 用 jieba_search 分词后:深圳科技有限公司 用 jieba_index 分词后:深圳、科技、科技、有限、公司、深圳科技有限公司

正常来说 深圳科技有限公司 不管用哪种分词策略都必须有:深圳科技有限公司、深圳科技 这两组词对吧!

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions