BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #19449同步于 2016/4/22
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

经管小白求教找单词之间的pattern关系

pingxiahuhu
2016/4/22镜像同步10 回复
自己问的这个问题的问法好不专业。。。 问题是这样的现在有几万个文本,其中一个文本内容是: Household income is the combined gross income of all the members of a household who are 15 years old and older. Individuals do not have to be related in any way to be considered members of the same household. Alternatively, household income is the combined income of all members of a household who jointly apply for credit. Household income is an important risk measure used by lenders for underwriting loans. 从这段话我知道:Household income和gross income的关系是Household income是gross income之和。 。再比如有段话是Apple is a kind of fruit。那我要发现的关系就是Apple属于fruit。 或者有段话是:Fruit, such as apple,banana and pear。那我要发现的关系就是apple属于Fruit,banana属于fruit,pear属于fruit。 我要做的是就是发现这些文本里这些粗体单词之间的关系,我现在有这些文本文件以及一个粗体单词的list。那我需要怎么做,用什么工具去发现这些单词,更具体说是名词之间的关系。教授让我做的第一件事就是把两个名词之间的那些文本给抽取出来。我这些文本都是英文的。 真的是编程小白啊,啥都不懂。。。
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
sdlslx机器人#1 · 2016/4/22
这不是简单的编程问题了…文本挖掘算法呐,郭组好像在做的东西
pingxiahuhu机器人#2 · 2016/4/22
要哭。。。在德国念的明明不是纯计算机,现在却天天要搞这些东西。。。 【 在 sdlslx 的大作中提到: 】 : 这不是简单的编程问题了…文本挖掘算法呐,郭组好像在做的东西
sdlslx机器人#3 · 2016/4/22
尝试从python的nltk库找找方案吧,非常齐全而强大的nlp库 【 在 pingxiahuhu (huhu) 的大作中提到: 】 : 要哭。。。在德国念的明明不是纯计算机,现在却天天要搞这些东西。。。
pingxiahuhu机器人#4 · 2016/4/22
有适合Java的吗?目前做的前期的工作都是在Java上完成的。。。 【 在 sdlslx 的大作中提到: 】 : 尝试从python的nltk库找找方案吧,非常齐全而强大的nlp库
wudikuail机器人#5 · 2016/4/22
吓 第一眼看到 以為是我男神做的NELL (http://rtw.ml.cmu.edu/rtw/) 发现关系肯定不容易 但是如果你只是要把粗体间得文本提出来的话 那还是很简单得 只要一个个词往下扫 比对就好
xiaochuo机器人#6 · 2016/4/23
Stanford core nlp 【 在 pingxiahuhu 的大作中提到: 】 : 有适合Java的吗?目前做的前期的工作都是在Java上完成的。。。 : 【 在 sdlslx 的大作中提到: 】 : : 尝试从python的nltk库找找方案吧,非常齐全而强大的nlp库 : : 发自「贵邮」
pzhfreeze机器人#7 · 2016/4/23
楼上正解。dependency tree就可以看出了 发自「贵邮」
jw8957机器人#8 · 2016/4/23
同意 ls && lss, 补充个 manual paper吧,最近正好做到了相关的东西。 http://nlp.stanford.edu/software/dependencies_manual.pdf
pingxiahuhu机器人#9 · 2016/4/23
哈哈哈哈哈,我已经找到这个了,然后教授说这个对于我目前的能力来看,不好上手,哈哈哈哈 【 在 xiaochuo 的大作中提到: 】 : Stanford core nlp : : 发自「贵邮」