Diffbot:人工智能算法和公共API【美国】
栏目分类:国外网站 发布日期:2022-07-28 浏览次数:次
网站logo:
网站名称:Diffbot
所属国家:美国
网站缩略图:
Diffbot首页缩略图
【官网介绍】知识即服务
Diffbot 的使命是通过构建第一个能够综合人类知识的自主系统来加速智能系统的出现。我们抓取整个公共网络并运行世界上最大的自动化知识图谱。
我们的价值
我们相信,对事实共同知识库的访问民主化将导致更智能和更值得信赖的系统。我们拥抱成长、赋权、同理心、原创思维,并且不怕应对重大挑战。
最先进的研究
我们的应用研究团队由以下领域的顶尖专家组成:结构化文档提取、实体链接、关系提取、共指解析、知识推理、知识融合和信息检索。
网络规模工程
Diffbot 在我们自己的定制组装硬件上运行自己的整个公共网络爬网,独立于 Google 和 Bing,位于我们位于加利福尼亚州的数据中心。我们是少数几个可以在快速发展的启动环境中从事网络规模机器学习、分布式系统和搜索引擎工作的地方之一。
Diffbot首页缩略图2
网站介绍:
Diffbot是美国一家指令机器学习和计算机视觉算法以及公共API开发的初创公司,该公司通过计算机视觉、机器学习和人工智能来处理Web页面,并计划实现整个网页的“机器可读”。
Diffbot公司通过将计算机视觉技术应用于网页,其中在视觉上解析了重要元素的网页并以结构化格式。2015年宣布通过抓取网络并使用其自动网页提取来构建一个结构化网络数据的大型数据库,从而开发其自动“ 知识图 ” 版本。
Diffbot的理念就是通过“视觉机器人”来扫描和识别不同的网页类型(主要是非结构化的数据),再将这些丰富的数据源应用于其他应用。Diffbot创始人兼首席执行官Mike Tung表示:“我们在获取页面之后会对其进行分析,然后通过成熟先进的技术进行结构化的处理。”
Diffbot的API使用计算机视觉将网页信息转化成数据库,软件开发者可以提取其中的数据进行再次利用,包括产品图片、航运成本、折扣价格、SKU码以及建议零售价等等。(信息来源于CloudTimes)
Diffbot将大多数Web页面划分为数个大类——新闻消息,头版,图片,事件和概要等等。Diffbot 首先识别这些部分,然后转化为可用的数据库格式。该公司已经发布了头版API和文章API,还有产品API。