最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

为了挖掘大数据中的商业价值,“玻森数据” 开放了一个中文语义分析

[复制链接]
跳转到指定楼层
楼主
发表于 2015-9-2 11:29:41 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

据 “玻森数据” 团队介绍,他们在语义分析技术与数据这个方向上已经有超过 7 年的积累,将实现算法优化到一个商业可用的效果。最近他们上线了新版的语义开放平台 BosonNLP,并全面免费开放给开发者。

所以到底什么是自然语义分析?现在的创业公司都面对着各种形式的大数据冲击,例如微博微信、客户反馈、邮件等等,如何充分利解读和利用这些数据对于公司增强自身的灵活性和竞争力很重要,面对大数据意味着需要更大的数据处理能力。


相比于市场上其他同类产品,BosonNLP 提供了更为全面的服务,包括分词词性、情感分析、实体识别、依存文法、关键词提取、新闻分类、语义联想、文本聚类以及典型意见。

而分词词性的准确率一般会成为用户对于自然语言处理的首要考虑标准,例如这样一句话:

座石像分别是苏富比拍卖行归还的难敌石像。

负责分词词性的标注引擎需要准确识别出 “苏富比” 是一个组织机构名称,以及 “难敌” 这个多重意思的特殊名词,才能将其准确标注。在今年 5 月份的 NLPCC 公开赛上,“玻森数据” 在中文分词与词性标注两项比赛中以 96.65% 与 91.55% 的准确率获得第一。

除了分词词性的准确性,机器更难辨识的是人类自然语言中的情感部分,例如下面这一句话:

罗暴力头球破门

机器需要将文本的情感分为正面和负面两类,而 “暴力” 一词很容易干扰机器判断,很多语义分析系统会将其判别为负面情感。BosonNLP 在情感分析的准确度可以达到 80% – 85%,并提供篇章级的分析能力。情感分析可用于汽车、餐饮以及电商消费中快速地找到正面或负面的评价。

相比于市面上其他的自然语义分析平台,“腾讯文智” 还处于测试阶段,准确性和应用范围还比较小,“海量” 则偏向于互联网营销与舆情监测服务,提供的 API 也很有限。

BosonNLP 所提供的是一个从基础的分词与词性标注,到文章的实体识别、情感判断,以及对多篇文本进行综合分析的完整系统。目前在咨询公司、媒体监测领域以及不少开发者的产品都有应用,其网站上提供了 10 类分析引擎 demo ,感兴趣的朋友可以去试试。



楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-4-27 02:23

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表