Zanran:数值数据搜索【英国】(搜索已关闭)
栏目分类:国外搜索引擎 发布日期:2020-12-27 浏览次数:次
网站名称:Zanran
周博搜索评分:★★★☆☆
网站地址:Zanran(搜索已关闭)
网站缩略图:
网站介绍:
Zanran提供比其他任何搜索引擎更有意义的数值结果。使用计算机视觉为我们的数据搜索引擎识别图形和表格 ,以及从PDF文档中查找和提取内容。
以下来自官方“关于Zanran”介绍:
在网上搜索数据与统计:
Zanran可帮助您在网络上查找“半结构化”数据。 这是人们以图形,表格和图表形式呈现的数字数据。例如,数据可以是PDF报告中的图形,也可以是Excel电子表格中的表格,也可以是HTML页面中显示为图像的条形图。使用传统的搜索引擎可能很难找到如此大量的信息,而传统的搜索引擎主要专注于查找文本,而不是图形,表格和条形图。简而言之:Zanran是Google的数据。
工作原理:
Zanran不能通过在文本中发现措辞并查找图像来工作- 相反。该系统检查数百万个图像,并为每个图像确定是图形,图表还是表格-是否具有数字内容。核心技术是获得专利的计算机视觉算法,该算法可以确定图像是否为数字-并且图像是否准确(约98%)。但是,互联网上的绝大多数图像不是图形等。因此,即使精度很高,您仍然会得到一些非数字图像。相比之下,查找表相对简单。找到表后,我们必须确定它是否本质上是数字-并且我们有相应的算法。然后,我们的程序在该图像附近获取合适的文本,并围绕该文本构建搜索引擎。目前,我们从HTML,PDF和Excel文件中提取表格和图像, 并将在不久的将来处理PowerPoint和Word文档。
以下来自官方主页介绍:
我们是一支由技术爱好者组成的小团队(团队中大多数拥有博士学位),我们位于英国北伦敦的伊斯灵顿。
我们的专长在于构建复杂的计算机视觉软件-主要用于PDF。
Zanran的第一个产品是其数据搜索引擎(zanran.com)。
利用我们为Zanran的数据搜索引擎开发的技术,我们创建了许多PDF提取解决方案-您可以在此处找到所有这些解决方案。
Zanran由其两名创始人和三名天使投资者私人持有。