ZJU_CVs Blog

CV Learning and Paper Reading.

Deformable Convolutional Networks

论文阅读

1、Introduction 提出了一种可以变形的卷积核和池化核,将原始的固定形状的正方形的卷积核转变为能适应物体形状的可变的卷积核,从而使卷积结构适应物体形变的能力更强, 传统的CNN靠池化等方法来适应物体的形变,如果物体形状及其复杂,往往效果很差 本文提出的可形变的卷积结构(Deformable Convolution Netwo...

U-GAT-IT

Unsupervised Generative Attentional Networks with Adaptive Layer-Instance Normalization for Image-to-Image Translation

1. Introduction 将attention机制引入生成器和判别器,能够引导生成器G关注那些区分源域与目标域的更重要的区域,从而使得G的性能能够更好发挥,并让G对于图像整体的改变与实体形变有更好的处理能力 在生成器的解码阶段采用自适应的ILN(Adaptive, adaptive instance-layer normalization) 2. Method Att...

CrackGAN A Labor-Light Crack Detection Approach Using Industrial Pavement Images Based on Generative Adversarial Learning

论文阅读

1、简介 问题提出: ”All black“ phenomenon:网络很容易地“收敛”到将所有像素视为背景(BG)的状态,并且实现很小的损失 原因:数据不平衡,Ground Truths(GT)精度差 解决方案: 为end-to-end训练引入crack-patch-only(CPO)...

Deep Clustering for Unsupervised Learning of Visual Features

code 1. Introduction 提出了一种聚类方法DeepCluster,将端对端学习和聚类结合起来,同时学习神经网络的参数和网络输出的特征进行聚类 DeepCluster使用标准聚类算法Kmeans迭代地对特征进行分组,并基于聚类结果作为监督来更新网络权重 2. Method Preliminaries 通过Convnet将原始图像映射到固定维度的向量...

CBAM Convolutional Block Attention Module

论文阅读

1、简介 SENet方法是在feature map的通道上进行attention生成,然后与原来的feature map相乘。 本文所提的attention只关注了通道层面上哪些层面上哪些会具有更强的反馈能力,但是在空间维度上并不能体现出attention 2、方法介绍 Channel attention module 首先将feature map在s...

f-AnoGAN Fast unsupervised anomaly detection with generative adversarial networks

论文阅读

1. Introduction 模型分为两个阶段: 阶段一:训练WGAN 输入随机噪声,通过生成对抗训练生成器G和鉴别器D 阶段二:训练Encoder 在WGAN训练完毕后,不再改变,由生成器作为decoder,与Encoder一起构成a...

Prototypical Networks for Few-shot Learning

论文阅读

1. Introduction 本文提出了一种可以用于few-shot learning 的原型网络(prototypical networks),该网络能识别出在训练过程中从未见过的新类别,并且对于每个类别只需要很少的样例数据。 2. Methods (1) Notation 在few-shot分类任务中,$S=\left{\left(\mathbf{x}{1}, y{1}...

Broad Learning System

An Effective and Efficient Incremental Learning System Without the Need for Deep Architecture

1. Introduction 深度学习中的模型待优化参数的数量庞大,通常需要耗费大量时间和机器资源来优化。 宽度学习是一种不需要深度结构的高效增强学习系统 2. Method 宽度学习系统(BLS)的前身是随机向量函数连接网络(random vector functional-link neural network) 其中RVFLN...

Residual Attention Network for Image Classification

1. Introduction 在视觉领域中Attention机制具有重大作用。Attention能使运算聚焦于特定区域,同时也可以使该部分区域的特征的到增强 very deep的网络结构结合残差连接在图像分类等任务中表现出极好的性能 所提出的残差注意力网络(residual attention network)具有以下属性: 增加更多注意力模型可以线性...

Image Databases

数据集收集

Image Databases 图像数据库 1、CVonline: http://homepages.inf.ed.ac.uk/rbf/CVonline/Imagedbase.htm 2、YACVID: http://riemenschneider.hayko.at/vision/dataset/index.php 3、http://academictorrents.com/coll...