Package org.miaixz.bus.core.text.dfa


package org.miaixz.bus.core.text.dfa
DFA全称为:Deterministic Finite Automaton,即确定有穷自动机 用所有关键字构造一棵树,然后用正文遍历这棵树,遍历到叶子节点即表示文章中存在这个关键字。 我们暂且忽略构建关键词树的时间,每次查找正文只需要O(n)复杂度就可以搞定。
Since:
Java 17+
Author:
Kimi Liu
  • Class
    Description
    匹配到的单词,包含单词,text中匹配单词的内容,以及匹配内容在text中的下标, 下标可以用来做单词的进一步处理,如果替换成**
    基于非确定性有穷自动机(NFA) 实现的多模匹配工具
    敏感词工具类
    敏感词过滤处理器,默认按字符数替换成*
    过滤词及一些简单处理
    DFA(Deterministic Finite Automaton 确定有穷自动机) DFA单词树(以下简称单词树),常用于在某大段文字中快速查找某几个关键词是否存在。 单词树使用group区分不同的关键字集合,不同的分组可以共享树枝,避免重复建树。 单词树使用树状结构表示一组单词。 例如:红领巾,红河 构建树后为: