框架

Tensorflow models

tensorflow官方自带的例子：https://github.com/tensorflow/models

算法模型

CNN

CS231n Convolutional Neural Networks for Visual Recognition

LSTM

Understanding LSTM Networks by colah

数据集

CV数据集

Name	Link	Info
ImageNet	http://www.image-net.org/about-stats	~1TB，1400多万幅图片，涵盖2万多个类别，超过百万的图片有明确的类别标注和图像中物体位置的标注
COCO	http://cocodataset.org/#home	~40GB，Common Object in Context
PASCAL VOC	http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html	~2GB PASCAL VOC挑战赛是视觉对象的分类识别和检测的一个基准测试，提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统。PASCAL VOC图片集包括20个目录：人类；动物（鸟、猫、牛、狗、马、羊）；交通工具（飞机、自行车、船、公共汽车、小轿车、摩托车、火车）；室内（瓶子、椅子、餐桌、盆栽植物、沙发、电视）。PASCAL VOC挑战赛在2012年后便不再举办，但其数据集图像质量好，标注完备，非常适合用来测试算法性能。
CIFAR	http://www.cs.toronto.edu/~kriz/cifar.html	~170MB CIFAR-10包含10个类别，50,000个训练图像，彩色图像大小：32x32，10,000个测试图像。CIFAR-100与CIFAR-10类似，包含100个类，每类有600张图片，其中500张用于训练，100张用于测试；这100个类分组成20个超类。图像类别均有明确标注。CIFAR对于图像分类算法测试来说是一个非常不错的中小规模数据集。
Open Image	https://github.com/openimages/dataset	~1.5GB（不包括图片），~900万张图像URL的数据集，里面的图片通过标签注释被分为6000多类。该数据集中的标签要比ImageNet（1000类）包含更真实生活的实体存在
Youtube-8M	https://research.google.com/youtube8m/	~1.5TB，来自youtube，共计8百万个视频，总时长50万小时，4800类。
深度学习数据集收集网站	http://deeplearning.net/datasets/
Tiny Images Dataset	http://horatio.cs.nyu.edu/mit/tiny/data/index.html	8000万的32x32图像，CIFAR-10和CIFAR-100便是从中挑选的。
CoPhIR	http://cophir.isti.cnr.it/whatis.html	雅虎发布的超大Flickr数据集，包含1亿多张图片。
MirFlickr1M	http://press.liacs.nl/mirflickr/	Flickr数据集中挑选出的100万图像集。
SBU captioned photo dataset	http://dsl1.cewit.stonybrook.edu/~vicente/sbucaptions/	Flickr的一个子集，包含100万的图像集。
NUS-WIDE	http://lms.comp.nus.edu.sg/research/NUS-WIDE.htm	Flickr中的27万的图像集。
Large-Scale Image Annotation using Visual Synset(ICCV 2011)	http://cpl.cc.gatech.edu/projects/VisualSynset/	机器标注的一个超大规模数据集，包含2亿图像。
SUN dataset	http://people.csail.mit.edu/jxiao/SUN/	包含13万的图像的数据集。
MSRA-MM	http://research.microsoft.com/en-us/projects/msrammdata/	包含100万的图像，23000视频；微软亚洲研究院出品，质量应该有保障。
LSUN：用于场景理解和多任务辅助（房间布局估计，显着性预测等）	http://lsun.cs.princeton.edu/2016/
Caltech行人检测数据库	http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/
UMDFaces 人脸数据库	http://www.umdfaces.io/	一共8000+个类别，总共36W张人脸图片，标注数据
李子青组的 CASIA-WebFace(50万，1万个人)		需申请
MegaFace		华盛顿大学百万人脸MegaFace数据集，60G，邮件申请
南洋理工 WLFDB （Weakly Labeled Faces Database ）		70万+,6,025
微软的MSRA-CFW		202792 张, 1583人
汤晓欧实验室的CelebA		20万+，标注，Large-scale CelebFaces Attributes (CelebA) Dataset
FaceScrub		100,100张，530人
搜狗实验室数据集		包括人物、动物、建筑、机械、风景、运动等类别，总数高达2,836,535张图片

标注工具

NLP 标注工具

| 工具 | 链接 | |—+—| | BRAT | |

图像标注工具

| 工具 | 链接 | 描述 | |—+—+—| | labelImg | https://github.com/tzutalin/labelImg | | | BBox-Label-Tool || | | Yolo_mark | https://github.com/AlexeyAB/Yolo_mark | YOLO v2 标注工具|

视频标注工具

| 工具 | 链接 | |—+—| | vatic | http://web.mit.edu/vondrick/vatic/ | | CDVA（compact descriptor for video analysis）||

论文

CV

Title	Link	Info
Speed/accuracy trade-offs for modern convolutional object detectors	https://arxiv.org/pdf/1611.10012.pdf

NLP

NLP相关资源

书籍

Title	Link	Info
Interpretable machine learning	https://christophm.github.io/interpretable-ml-book/intro.html

机器学习资料收集

目录

框架

Tensorflow models

算法模型

CNN

LSTM

数据集

CV数据集

标注工具

NLP 标注工具

图像标注工具

视频标注工具

论文

CV

NLP

书籍

学习资料

singleye

机器学习资料收集

目录

框架

Tensorflow models

算法模型

CNN

LSTM

数据集

CV数据集

标注工具

NLP 标注工具

图像标注工具

视频标注工具

论文

CV

NLP

书籍

学习资料

singleye

OCR 项目上线了

SLAM 算法传感器融合方法

欧拉角、旋转矩阵、四元数、轴角相互转换

基于 Kalman filter 的目标跟踪

在 Apple silicon (M3 Max) 上对 Llama2 进行微调

tmux AI 助手

使用 ros::waitForShutdown() 导致 dynamic_reconfigure::Server 无法正常获取配置更新的问题

PCL 3D 空间检测平行四边形

javascript var/let/const 比较

django-rest-framework 和 simplejwt 的类关系