1

我有一个大的文本,我想解析这个文本并识别(例如,存在于这个文本中的维基百科条目)。 我想过使用正则表达式,比如:pattern='New York|Barak Obama|Russian Feder...

我正在尝试使用OpenNLP为命名查找器API生成的自定义功能。 http://opennlp.apache.org/documentation/1.5.3/manual/opennlp.html ...

我有一堆描述疾病的文本文档。这些文件在大多数情况下都很短,通常只包含一句话。此处给出了一个示例: 原发性肺动脉高压是一种进行性疾病,其最小肺动脉广泛闭塞导致肺血管阻力增加,进而导致右心室衰竭。 ...

实体提取库

我正在寻找一个可以进行文本分析和提取实体的库。 实体的类型/分类并不重要,重要的是确定有价值的东西。在这种情况下,实体宇宙是无限的,它不受固定字典的限制。 似乎有几个web服务可以做到这一点(NE...

我正在使用斯坦福命名实体识别器http://nlp.stanford.edu/software/CRF-NER.shtml而且效果很好。这是 List out = classifier.clas...

我正在使用斯坦福大学的CoreNLP解析器浏览一些文本,其中有日期短语,例如"十月的第二个星期一"和"过去的一年"。库将适当地将每个标记标记为一个日期命名实体,但是有没有办法通过编程获得整个日期短语?...

我正在使用条件随机场构建命名实体识别器,并正在寻找两件事: A) 用于个人、位置和组织实体的开源英语NER数据集 B) 英语NER功能列表 我已经查看了CoNLL-2003语料库,发现这正是我想...

一周前,我问了一些关于文本挖掘的问题,但我有点困惑,仍然没有回答,但现在我知道了我想做的事情。 情况: 我有很多包含HTML内容的下载页面。例如,其中一些可以是来自博客的文本。它们不是结构化的,来自...

在iOS电子邮件客户端中,当电子邮件包含日期、时间或位置时,文本将变成超链接,只需点击链接即可创建约会或查看地图。它不仅适用于英文电子邮件,也适用于其他语言的电子邮件。我喜欢这个功能,并想了解他们是如...

我需要使用Perl从文本块中提取名称(包括不常见的名称)。我研究过这个模块来提取名字,但它只有1990年美国最流行的1000个名字和姓氏;我需要更全面的东西。 我考虑过使用社会保障指数建立一个数据库进行比较,但这似乎非常繁琐,而且需要大量处理。有没有一种方法可以使用另一种方法从Perl中提取名称? 要分析的文本示例: 拉德尼尔路易·安东尼·拉德尼尔,现年48岁,阿拉巴马州莫比尔市人,于2...