PHP-TrieTree
这是一个支持中英文混合的PHP的字典树
注1:本字典树是在 https://github.com/AbelZhou/PHP-TrieTree 的基础上做了进一步的修改,本想将个人的优化更新push到该仓库,但作者由于客观原因不方便merge我的更改,故重新开了仓库。
注2:测试的词库引用了Abel的,谢谢Abel
示例
<?php require "../src/TrieTree.php"; $testArr = array("张三","张四","王五","张大宝","张三四","张氏家族","王二麻子"); $tree = new KeywordTrieTree(); foreach ($testArr as $str){ $tree->append($str); } $res = $tree->getTree(); var_dump($res); $res = $tree->search("有一个叫张三的哥们"); var_dump($res); $res = $tree->search("我叫李四喜"); var_dump($res); //删除 $res = $tree->delete("张三"); //删除整棵树 连带“张三”和张三下的“张三四”一并删除 $tree->delete("张三",true);
使用场景
敏感词过滤 内链建设性能
test目录下有个1.5w左右的敏感词。 mac下检索耗时2~5毫秒左右 这些敏感词来自网络,不是很全。
版权声明:
1、该文章(资料)来源于互联网公开信息,我方只是对该内容做点评,所分享的下载地址为原作者公开地址。2、网站不提供资料下载,如需下载请到原作者页面进行下载。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考学习用!
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。