快好知 kuaihz

达观数据:做好计算机的语文老师教会机器能够理解

“文本挖掘”、“搜索推荐技术”、“知识图谱”这些词汇乍一听还真让人有些摸不着头脑。

“其实,我们就像是计算机的语文老师,教会机器能够理解人类的文字以及其所代表的含义,从而帮助我们更高效地完成一系列文字工作。”达观数据创始人陈运文的解释让人“秒懂”。

数据赋能的黄金时代

数据的飞速发展显然是我们始料未及的。

在过去的十年里,我们所创造的数据量,已超过人类历史的数据总量。

每天,我们打电话、发信息、搜索、旅行、购物,做任何事情都在创造新的数据数据将成为我们世界里最强大的一种力量。

而这种力量不仅来自于巨大的数据量,更重要的在于大数据背后的价值,也就是给数据赋能的过程。这就需要各个专业领域的数据服务公司对大数据进行挖掘和利用。

达观数据便是这样一家专注于文本智能处理领域的人工智能企业。

“我们的计算机运营能力远远超过10年前,与此同时我们的数据存储成本也大大的降低。” 陈运文回想起5年前在学校的实验室里百万的数据量已经到了极限,而如今,至少是以亿为单位的体量才能称得上大数据。这对于数据应用产业发展无疑是非常有利的。

“这是数据赋能的黄金时代”,陈运文很庆幸达观数据在这样一个时代创建并快速发展。

数据进阶:从数据化走向智能化

足够多的数据推动了行业的快速发展。

“其实这个世界已经不缺数据,缺的是对数据精加工的能力,原始的数据如果不做处理,价值很小。” 陈运文表示。

陈运文解释,“用一句常说的中国老话来形容:熟读唐诗三百首,不会作诗也会吟。”如果让计算机阅读成千上万篇文章,它也可以从中总结规律。计算机拥有强大的运算和存储能力,可以比人做得更好。而达观要做的就是训练计算机拥有这样的能力,就像AlphaGo在学习了30万盘棋谱后,就能打败人类。

在大数据的初级阶段,我们更重视的是数据的采集,一个很好的趋势,也将在很大程度上促进智能化的发展。但我们仍然需要面对缺乏有质量数据的现实,很多行业的数据信息还停留在纸面上,没有数字化或者说文档没有做到很好的标注,无法让计算机进行高效处理。

随着数据采集技术的普及,数据不再稀缺。数据挖掘和数据应用的未来发展前景广阔、市场巨大,包括房地产、汽车、零售、法律等在内的各行各业都有引入智能化数据处理的需求。

数据时代也将从数据化逐步进阶,走向智能化。

帮到每一个和文字打交道的人

中国有很多大中型企业,拥有大量的数据、资料和内容性信息,但缺乏数据处理能力让很多有意义的数据淹没其中得不到利用。

智能化的数据处理技术对这些文档材料进行自动分类、归档、提取出有用信息,最终帮助企业降低人力成本、提高经济效益。

陈运文认为,如何让计算机智能地处理文本数据,是一件非常重要的事情。“我们做的事情是对文本数据进行挖掘处理,使之以结构化的方式呈现出来,提升人们的工作效率。”

如今,达观数据的技术可以帮助律师处理大量的文本资料;帮助金融机构建立智能客服以及理财产品推荐系统;帮助企业通过文档语义提取、资料精准推荐建立行业知识图谱;在传媒行业自动打标签、审核过滤、建立个性化推荐;在电商行业建立客户画像建模等一系列应用。

达观数据的一台服务器能够代替15个工作人员处理各种与文字相关的企业数据,大大提高了企业效率,辅助人们完成各种繁重而重复的文本工作,大大降低出错率。

“我想让我们的技术帮到每一个与文字打交道的人,让他们从重复性的文字工作中解脱出来,有更多的时间去创造新的可能性。”正如陈运文给公司起的名字一样,对于人工智能的未来,他的态度是通达、乐观。

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:达观  达观词条  教会  教会词条  语文  语文词条  理解  理解词条  能够  能够词条