当前位置: 首页 > 业内资讯

腾讯 AI Lab 开源业内最大规模多标签图像数据集

发布日期:2019-04-01 14:06:25 | 编辑:互联网运营| 阅读次数:

速途9月10日消息(报道:李楠)今天,腾讯人工智能实验室公布的九月开源“腾讯到底ML-图像”项目,由多个标签的项目的RE-101的图像数据集ML - 图片,类似的深度行业,最准确的深度残余信封学习模式。

据速途据了解,该项目是在积累了计算机视觉的基础上,AI腾讯的领域开放源码实验室功能首次发布,在质量的训练数据,人工智能领域提供了大量的科学家和工程师,和易用性,共同发展强大的深度学习模式,推动人工智能行业。

腾讯公布的人工智能实验室的图像数据将ML-画面,它包含了18万倍的图像和1。超过10,000种常见对象类的。此外,腾讯AI实验室还将提供深度残差Res-101基于网络的训练,以获得一图象ML-。这种模式有视觉表现优异的性能和推广能力,在同行业中最高的精度与现款车型,包括图片,视频等。,它提供了支持,以强烈的视觉任务,并有助于图像分类,目标检测,目标跟踪,语义技术来提升水平分割。

深入学习神经网络技术,深度典型许多领域得到了充分展现其卓越的功能,包括分类,理解和产生其他重要任务,特别是在计算机视觉,图像和视频,现场。但是,要充分发挥学习视觉表现的深度的能力,因此必须根据培训方法足够的容量,高质量的训练数据,优良的模型结构和模型,以及强大的计算资源,。

人工智能技术公司的主要功能高度重视打好基础,我们只用于内部数据的Instagram集JFT-300M谷歌和Facebook,如建立一个大的图像数据集。然而,数据收集模式已经一般研究机构和中小企业他们的训练是不公开的,人工智能的这些基本功能,具有非常高的门槛。

在同行业中最大的开放标签的多图像数据是开放谷歌的图像,包括9万个像素,并已培训了超过6000级的对象类别。腾讯开源人工智能实验室ML-图像训练数据集包括18000000个图像和1。超过10,000个普通的对象类,或将成为新的行业基准数据集。除了数据收集,腾讯AI实验室团队将详细开源项目介绍:

1)多尺度标签图像数据集的构建,所述方法包括所述源图像的图像类,一组候选图像类别和语义关系注释的。在构建过程ML-画面,一队充分利用类别的语义关系,以帮助精确的图像注释。

2)基于训练神经网络图像的深度ML-。功能训练方法和设计团队的损失能有效地抑制大的多标签数据集的负面影响是不均衡的培训课程的典范。

基于模型的RE-101-图像ML- 3)在训练获得的,并具有优异的视觉表示一般化。通过研究验证组的迁移模式,取得80张图片。图1是一个顶分类精度比同类模型谷歌(学习模式传输)73%的准确度,这是值得注意的图像的ML-大小的是,只有约1/17 JFT-300M。这充分说明了训练方法的质量和效果ML-图像。在下表中详细比较。


注意:在RE-101模型非转移培训和学习的楷模微软已经1.2M-之前训练图像作为原始图像数据组的图像。

腾讯人工智能实验室开源“腾讯ML-图像”项目,显示腾讯的努力在人工智能,视觉的基本技能,建设,希望通过一个开放的基础能力,以促进行业的共同发展。

深度学习模型“腾讯ML-图像”项目,已在许多企业腾讯起到了重要的作用,如“天天快车”图像质量评价与功能。

如下图所示,在盖的图像质量的消息公告显著改善日图。


经过优化:左:优化前右

此外,人工智能实验室团队腾讯ML-RES -101模型图像根据一些其他视觉任务,包括检测对象图像,图像分割语义视频对象分割,视频对象跟踪移动。这些视觉迁移任务,进一步验证了强大的视觉表现能力和优异的性能推广模式。“腾讯ML-形象”,在该项目的未来将在视觉相关产品更重要的角色。

自2016年,腾讯发布在GitHub上的第一个开源项目(累计收入已经覆盖到人工智能,移动开发,现场小程序等57个项目。为了进一步促进开源社区,腾讯也加入了Hyperledger,LF工作和开放的网络架构,并成为第一个LF的创始成员深学习基金会和Linux基金会白金会籍。随着技术在腾讯领域的“开放”战略体现了腾讯开放源码技术的研究和开发将继续推动内部共享,重用和开源的未来,腾讯发布向外R&d强度,为国内外提供对于开源社区的技术支持,振兴R&d。

本文链接:腾讯 AI Lab 开源业内最大规模多标签图像数据集

上一篇:老板们,悄悄告诉你做好网络营销的秘诀是什么?

下一篇:药品合规时代 如何做好互联网学术营销

友情链接:

经文 心经唱诵 大悲咒注音

Copyright © 2017 互联网运营 版权所有 All Rights Reserved. 网站地图

苏ICP备18043316号