面向服务的架构在新兴 Hadoop 世界中的作用
就在几年前,大多数业务人员,甚至大多数数据分析师还不知道文本分析。如今,越来越多的组织不仅意识到文本分析,而且亲自尝试。随着意识的增强,期望也随之扩大:识别文本的主题还不够,压力还在于识别情感、在微小的文本片段中发现意义、实时挖掘大量文本以及分析书面文本使用分析师无法阅读的语言。 想一想最后一项:分析用分析师无法阅读的语言编写的文本。 到目前为止,文本分析背后的主要驱动力是速度——征服人类调查人员根本没有时间阅读和解释的大量文本。这种情况即将改变。随着文本分析进入企业和政府的工具包,他们要求更多的东西——跨语言文本分析,这些工不理解的语言编写的文本。 谁想要跨语言分析? 更多阅读 大数据和知识产权法 大数据和人工智能与知识产权法的冲突课程 – 完整指南 人工智能增强营销策略的 4 种方式 软件物料清单对于人工智能驱动的网络安全至关重要 数据驱动型公司的 IT 预算实践 翻译人工智能:学习说全球语言 据布达佩斯的这家翻译公司称,西方国家的市场研究人员正在研究亚洲消费者的偏好,反之亦然。 具使分析师能够挖掘用他们自己 在美国讲英语的人对新移民的政治问题感兴趣。 弗里多尼亚的情报机构正在寻找穆西瓦尼亚的恐怖活动迹象。 … 等等。 他们进展如何?有些人将文本翻译成自己的语言,然后将通常的文本分 法国手机号码清单 析过程应用于翻译后的文本。这种方法有很大的问题。如果您曾经阅读过机器翻译的文本,您就会知道它并不完美,远非完美。如果文本挖掘对于原始形式的文本来说很困难,想象一下当文本被机器翻译时会出现的质量问题。更重要的是,当应用于大量文本时,即使是机器翻译也可能成本高昂。质量差而成本高是个坏消息;好消息是有更好的方法来解决这个问题。 当尽可能多的过程以文本的原始语言执行时,跨语言文本分析会更加准确且成本更低。将翻译保持在最低限度,并使用专为处理您所需的语言而构建的工具。 阅读该流程的概要 并注意如何最大限度地减少翻译: 跨语言文本分析过程