ZJU_CVs Blog

CV Learning and Paper Reading.

Awesome Model Compression and Acceleration

Survey A Survey of Model Compression and Acceleration for Deep Neural Networks [arXiv ‘17] Recent Advances in Efficient Computation of Deep Convolutional Neural Networks [arXiv ‘18] Model a...

Awesome Video Anomaly Detection

Datasets UMN Download link UCSD Download link Subway Entrance/Exit Download link CUHK Avenue Download link HD-Avenue ShanghaiTech Download link HD-Shanghai...

SinGAN

Learning a Generative Model from a Single Natural Image

code 1. Introduction 介绍了 SinGAN,这是一种无条件的生成模型,可以从单个自然图像中学习。 模型经过训练,可以捕获图像内斑块的内部分布,生成高质量、多样化的样本,并承载与图像相同的视觉内容。 SinGAN 包含一个完全卷积的 GAN 金字塔,每个 GAN 负责学习图像不同比例的 patch 分布,可以生成任意大小和纵横比的新样本,这些样本具有明...

Patch SVDD

Patch-level SVDD for Anomaly Detection and Segmentation

1. Introduction 异常检测和分割: 异常检测包括对输入图像是否包含异常进行二元判断 异常分割的目的是对异常进行像素级的定位 One-class support vector machine (OC-SVM)和Support vector data description (SVDD)都是用于one-class classifica...

Explainable Deep One-Class Classification

1. Introduction 异常检测任务是识别一组数据中的异常,而目前基于异常分数的一些方法在可解释性方面研究有限 DSVDD作为一种常见的异常检测方法,能够将正常数据聚集到预定的中心,而异常数据则为离群点位于其他位置 本文提出了FCDD,是对DSVDD的一种改进。通过使用卷积层和池化层,实现对输入图像中异常像素点的判别,从而识别异常区域 2. Method ...

Learning Attentive Pairwise Interation for Fine-Grained Classification

1. Introduction 细粒度分类问题的大多数方法都是通过学习单个输入图像的区别性表征 (discriminative representation)来解决 而人类可以通过比较图像对来有效识别对比信息,如下图中的两个不同品种的海燕图,如果仅查看单张图片,很难识别其属于哪一类,尤其是当对象被嘈杂的背景遮挡时。而通过图片对的相互对比,则可以很好的区分两种品类 因此,本文提...

Destruction and Construction Learning for Fine-grained Image Recognition

1. Introduction 目标局部(part)的精细特征表示在精细识别(fine-grained recognition)中起着关键作用。现有的精细识别方法可以大致分为两类: 一种是首先定位有判别性的目标局部区域,然后根据这些判别区域进行分类,这种两步法需要在目标或目标局部上添加额外的边界框标注,这些标注的成本往往都很高,如图(a) ...

Learning to Navigate for Fine-grained Classification

code: https://github.com/yangze0930/NTS-Net 1. Introduction 由于很难找到区分性的特征(discriminative features)用于充分表征物体的细微特征,因此细粒度分类具有挑战 细粒度分类模型的设计的关键在于准确识别图像中的信息区域。之前的一些方法采用human annotation,...

Dual Attention Network for Scene Segmentation

1. Introduction 提出了双重注意力网络(DANet)来自适应集成局部特征和全局依赖 在FCN上附加两种类型的注意力模块,分别模拟空间和通道维度中的语义相互依赖性。 位置注意力模块通过所有位置处的特征的加权和来选择性地聚合每个位置的特征。无论距离如何,类似的特征都将彼此相关 通道注意力模块通过整合所有通道映射之间的相关特征来选择性地强调存在相...

Drop an Octave

Reducing Spatial Redundancy in Convolutional Neural Networks with Octave Convolution

1. Introduction 在自然图像中,信息以不同的频率传递,其中较高的频率通常用精细的细节编码,较低的频率通常用全局结构编码。(低频部分对应灰度图中变化平缓的部分,高频部分对应灰度图中变化剧烈的部分。具体表现出来,低频部分对应的图片整体结构,而高频部分对应的边缘细节) 同样,卷积层的输出特征图也可以看作是不同频率下信息的混合。 ...