机器学习资料收集
目录
框架
Tensorflow models
- tensorflow官方自带的例子:https://github.com/tensorflow/models
算法模型
CNN
LSTM
数据集
CV数据集
Name | Link | Info |
---|---|---|
ImageNet | http://www.image-net.org/about-stats | ~1TB,1400多万幅图片,涵盖2万多个类别,超过百万的图片有明确的类别标注和图像中物体位置的标注 |
COCO | http://cocodataset.org/#home | ~40GB,Common Object in Context |
PASCAL VOC | http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html | ~2GB PASCAL VOC挑战赛是视觉对象的分类识别和检测的一个基准测试,提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统。PASCAL VOC图片集包括20个目录:人类;动物(鸟、猫、牛、狗、马、羊);交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车);室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。PASCAL VOC挑战赛在2012年后便不再举办,但其数据集图像质量好,标注完备,非常适合用来测试算法性能。 |
CIFAR | http://www.cs.toronto.edu/~kriz/cifar.html | ~170MB CIFAR-10包含10个类别,50,000个训练图像,彩色图像大小:32x32,10,000个测试图像。CIFAR-100与CIFAR-10类似,包含100个类,每类有600张图片,其中500张用于训练,100张用于测试;这100个类分组成20个超类。图像类别均有明确标注。CIFAR对于图像分类算法测试来说是一个非常不错的中小规模数据集。 |
Open Image | https://github.com/openimages/dataset | ~1.5GB(不包括图片) ,~900万张图像URL的数据集,里面的图片通过标签注释被分为6000多类。该数据集中的标签要比ImageNet(1000类)包含更真实生活的实体存在 |
Youtube-8M | https://research.google.com/youtube8m/ | ~1.5TB,来自youtube,共计8百万个视频,总时长50万小时,4800类。 |
深度学习数据集收集网站 | http://deeplearning.net/datasets/ | |
Tiny Images Dataset | http://horatio.cs.nyu.edu/mit/tiny/data/index.html | 8000万的32x32图像,CIFAR-10和CIFAR-100便是从中挑选的。 |
CoPhIR | http://cophir.isti.cnr.it/whatis.html | 雅虎发布的超大Flickr数据集,包含1亿多张图片。 |
MirFlickr1M | http://press.liacs.nl/mirflickr/ | Flickr数据集中挑选出的100万图像集。 |
SBU captioned photo dataset | http://dsl1.cewit.stonybrook.edu/~vicente/sbucaptions/ | Flickr的一个子集,包含100万的图像集。 |
NUS-WIDE | http://lms.comp.nus.edu.sg/research/NUS-WIDE.htm | Flickr中的27万的图像集。 |
Large-Scale Image Annotation using Visual Synset(ICCV 2011) | http://cpl.cc.gatech.edu/projects/VisualSynset/ | 机器标注的一个超大规模数据集,包含2亿图像。 |
SUN dataset | http://people.csail.mit.edu/jxiao/SUN/ | 包含13万的图像的数据集。 |
MSRA-MM | http://research.microsoft.com/en-us/projects/msrammdata/ | 包含100万的图像,23000视频;微软亚洲研究院出品,质量应该有保障。 |
LSUN:用于场景理解和多任务辅助(房间布局估计,显着性预测等) | http://lsun.cs.princeton.edu/2016/ | |
Caltech行人检测数据库 | http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/ | |
UMDFaces 人脸数据库 | http://www.umdfaces.io/ | 一共8000+个类别,总共36W张人脸图片,标注数据 |
李子青组的 CASIA-WebFace(50万,1万个人) | 需申请 | |
MegaFace | 华盛顿大学百万人脸MegaFace数据集,60G,邮件申请 | |
南洋理工 WLFDB (Weakly Labeled Faces Database ) | 70万+,6,025 | |
微软的MSRA-CFW | 202792 张, 1583人 | |
汤晓欧实验室的CelebA | 20万+,标注,Large-scale CelebFaces Attributes (CelebA) Dataset | |
FaceScrub | 100,100张,530人 | |
搜狗实验室数据集 | 包括人物、动物、建筑、机械、风景、运动等类别,总数高达2,836,535张图片 |
标注工具
NLP 标注工具
| 工具 | 链接 | |—+—| | BRAT | |
图像标注工具
| 工具 | 链接 | 描述 | |—+—+—| | labelImg | https://github.com/tzutalin/labelImg | | | BBox-Label-Tool || | | Yolo_mark | https://github.com/AlexeyAB/Yolo_mark | YOLO v2 标注工具|
视频标注工具
| 工具 | 链接 | |—+—| | vatic | http://web.mit.edu/vondrick/vatic/ | | CDVA(compact descriptor for video analysis)||
论文
CV
Title | Link | Info |
---|---|---|
Speed/accuracy trade-offs for modern convolutional object detectors | https://arxiv.org/pdf/1611.10012.pdf |
NLP
书籍
Title | Link | Info |
---|---|---|
Interpretable machine learning | https://christophm.github.io/interpretable-ml-book/intro.html |