目录

框架

Tensorflow models

算法模型

CNN

LSTM

数据集

CV数据集

Name Link Info
ImageNet http://www.image-net.org/about-stats ~1TB,1400多万幅图片,涵盖2万多个类别,超过百万的图片有明确的类别标注和图像中物体位置的标注
COCO http://cocodataset.org/#home ~40GB,Common Object in Context
PASCAL VOC http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html ~2GB PASCAL VOC挑战赛是视觉对象的分类识别和检测的一个基准测试,提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统。PASCAL VOC图片集包括20个目录:人类;动物(鸟、猫、牛、狗、马、羊);交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车);室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。PASCAL VOC挑战赛在2012年后便不再举办,但其数据集图像质量好,标注完备,非常适合用来测试算法性能。
CIFAR http://www.cs.toronto.edu/~kriz/cifar.html ~170MB CIFAR-10包含10个类别,50,000个训练图像,彩色图像大小:32x32,10,000个测试图像。CIFAR-100与CIFAR-10类似,包含100个类,每类有600张图片,其中500张用于训练,100张用于测试;这100个类分组成20个超类。图像类别均有明确标注。CIFAR对于图像分类算法测试来说是一个非常不错的中小规模数据集。
Open Image https://github.com/openimages/dataset ~1.5GB(不包括图片) ,~900万张图像URL的数据集,里面的图片通过标签注释被分为6000多类。该数据集中的标签要比ImageNet(1000类)包含更真实生活的实体存在
Youtube-8M https://research.google.com/youtube8m/ ~1.5TB,来自youtube,共计8百万个视频,总时长50万小时,4800类。
深度学习数据集收集网站 http://deeplearning.net/datasets/
Tiny Images Dataset http://horatio.cs.nyu.edu/mit/tiny/data/index.html 8000万的32x32图像,CIFAR-10和CIFAR-100便是从中挑选的。
CoPhIR http://cophir.isti.cnr.it/whatis.html 雅虎发布的超大Flickr数据集,包含1亿多张图片。
MirFlickr1M http://press.liacs.nl/mirflickr/ Flickr数据集中挑选出的100万图像集。
SBU captioned photo dataset http://dsl1.cewit.stonybrook.edu/~vicente/sbucaptions/ Flickr的一个子集,包含100万的图像集。
NUS-WIDE http://lms.comp.nus.edu.sg/research/NUS-WIDE.htm Flickr中的27万的图像集。
Large-Scale Image Annotation using Visual Synset(ICCV 2011) http://cpl.cc.gatech.edu/projects/VisualSynset/ 机器标注的一个超大规模数据集,包含2亿图像。
SUN dataset http://people.csail.mit.edu/jxiao/SUN/ 包含13万的图像的数据集。
MSRA-MM http://research.microsoft.com/en-us/projects/msrammdata/ 包含100万的图像,23000视频;微软亚洲研究院出品,质量应该有保障。
LSUN:用于场景理解和多任务辅助(房间布局估计,显着性预测等) http://lsun.cs.princeton.edu/2016/
Caltech行人检测数据库 http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/
UMDFaces 人脸数据库 http://www.umdfaces.io/ 一共8000+个类别,总共36W张人脸图片,标注数据
李子青组的 CASIA-WebFace(50万,1万个人) 需申请
MegaFace 华盛顿大学百万人脸MegaFace数据集,60G,邮件申请
南洋理工 WLFDB (Weakly Labeled Faces Database ) 70万+,6,025
微软的MSRA-CFW 202792 张, 1583人
汤晓欧实验室的CelebA 20万+,标注,Large-scale CelebFaces Attributes (CelebA) Dataset
FaceScrub 100,100张,530人
搜狗实验室数据集 包括人物、动物、建筑、机械、风景、运动等类别,总数高达2,836,535张图片

标注工具

NLP 标注工具

| 工具 | 链接 | |—+—| | BRAT | |

图像标注工具

| 工具 | 链接 | 描述 | |—+—+—| | labelImg | https://github.com/tzutalin/labelImg | | | BBox-Label-Tool || | | Yolo_mark | https://github.com/AlexeyAB/Yolo_mark | YOLO v2 标注工具|

视频标注工具

| 工具 | 链接 | |—+—| | vatic | http://web.mit.edu/vondrick/vatic/ | | CDVA(compact descriptor for video analysis)||

论文

CV

Title Link Info
Speed/accuracy trade-offs for modern convolutional object detectors https://arxiv.org/pdf/1611.10012.pdf

NLP

NLP相关资源

书籍

Title Link Info
Interpretable machine learning https://christophm.github.io/interpretable-ml-book/intro.html

学习资料