C语言学习网

如何利用HanLP计算中文词语语义相似度

发表于:2022-08-19 作者:安全数据网编辑
编辑最后更新 2022年08月19日,小编给大家分享一下如何利用HanLP计算中文词语语义相似度,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!在java项目中配

小编给大家分享一下如何利用HanLP计算中文词语语义相似度,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

在java项目中配置HanLP

推荐使用Maven方法

在poem.xml中加入以下代码

    com.hankcs    hanlp    portable-1.3.3

但是在AndroidStudio中,没有Maven,所以在build.gradle的dependencies中加入如下代码

compile "com.hankcs:hanlp:portable-1.3.3"
还可以下载jar包和data包,使用hanlp.properties进行手动配置
  1. 在 IntelliJ IDEA中进入file -> project structure,在Libraries中添加jar包

  2. 更改hanlp.properties中的首行,指向data包所在的位置

  3. 将hanlp.properties放在out -> production -> name目录下

调用HanLP

import com.hankcs.hanlp.dictionary.CoreSynonymDictionary;

只需要以上语句便可以使用HanLP

//使用hanlp计算语义距离double[] numarray = new double[title_list.size()];    for (int i = 0; i < results.size(); i++) {        for (int j = 0; j < title_list.size(); j++) {            numarray[j] += CoreSynonymDictionary.similarity(results.get(i).name().toString(), title_list.get(j).toString());        }    }

以上是"如何利用HanLP计算中文词语语义相似度"这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!

0