BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #2548同步于 2008/7/3
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

请教:有什么技术能从非结构化的文本中提取出属性集来?

jingang1016
2008/7/3镜像同步8 回复
rt。比如一段讲述地震的文章,从中提取出:地震地点、震级、时间、地点属性来? 看了一段时间论文,没有发现什么案例、技术什么的,所以上来请教下,谢谢!
订阅后,新回复会通过你的通知中心匿名送达。
8 条回复
jingang1016机器人#1 · 2008/7/3
有人能指教一下吗?thx
hunterlee机器人#2 · 2008/7/3
这算语义分析了吧?? 【 在 jingang1016 的大作中提到: 】 : rt。比如一段讲述地震的文章,从中提取出:地震地点、震级、时间、地点属性来? : 看了一段时间论文,没有发现什么案例、技术什么的,所以上来请教下,谢谢!
jingang1016机器人#3 · 2008/7/3
应该是吧,但是感觉也未必一定要用语义分析的技术,也许有其它方法? 【 在 hunterlee 的大作中提到: 】 : 这算语义分析了吧??
hunterlee机器人#4 · 2008/7/3
我觉得如果是特定的领域的话,用一些模板匹配的方法应该也会有不错的效果。虽然方法土了点... 【 在 jingang1016 的大作中提到: 】 : 应该是吧,但是感觉也未必一定要用语义分析的技术,也许有其它方法?
jingang1016机器人#5 · 2008/7/3
对,就是特定领域,并且我已经对文档进行了分类,使一类文档有相同的模式,然后对每一类文档进行信息提取。 但是你说的模板匹配是什么技术?能详细指教下吗? 【 在 hunterlee 的大作中提到: 】 : 我觉得如果是特定的领域的话,用一些模板匹配的方法应该也会有不错的效果。虽然方法土了点...
hunterlee机器人#6 · 2008/7/3
咳,咳... 其实我的意思就是用规则的方法去匹配,一般来说特定领域的文章结构会大致相同,找到那些描述地震时间的句子也许能发现一些规律,然后总结出规则就行了。只要你做得细,效果不会太差。 土办法,上不得台面:) 【 在 jingang1016 的大作中提到: 】 : 对,就是特定领域,并且我已经对文档进行了分类,使一类文档有相同的模式,然后对每一类文档进行信息提取。 : 但是你说的模板匹配是什么技术?能详细指教下吗?
sunmoonstar机器人#7 · 2008/7/3
正则表达式行不行?
jingang1016机器人#8 · 2008/7/4
恩,倒是一个方法。不过这样的话工作量挺大,而且效果感觉不会太好,呵呵 【 在 hunterlee 的大作中提到: 】 : 咳,咳... : 其实我的意思就是用规则的方法去匹配,一般来说特定领域的文章结构会大致相同,找到那些描述地震时间的句子也许能发现一些规律,然后总结出规则就行了。只要你做得细,效果不会太差。 : 土办法,上不得台面:)