ZJU_CVs Blog

CV Learning and Paper Reading.

Git指令整理

常用的 Git 指令

GitHub创建仓库提示代码 echo "# 项目名" >> README.md git init git add README.md git commit -m "first commit" git remote add origin git@github.com:qiubaiying/项目名.git git push -u origin master 若仓库存在直接pu...

Facial Expression Recognition by De-expression Residue Learning

1. Introduction 核心思想:一个人的人脸表情是由表情和中性脸组成 \[Expression = Neutral+ Expressive\] 方法:通过De-expression Residue Learning,提取面部表情组成部分的信息。 2. DeRL Model 首先通过cGAN训练一个生成模型,来学习用expression的图像生成中立图像 ...

Attention U-Net

Learning Where to Look for the Pancreas

1. Introduction 提出了一种注意力门模型(Attention Gate, AG),用该模型进行训练时,能够抑制模型学习与任务无关的部分,同时加重学习与任务有关的特征 Attention gate可以很容易地集成到标准CNN体系结构中 2. Method Attention-Unet模型是以Unet模型为基础,其和unet的区别在于解码时,从编码...

Awesome-ßLightweight Models

轻量化模型总结

模型轻量化方法总结 卷积核分解:使用$1\times N$和$N\times 1$卷积核代替$N\times N$卷积核 使用深度压缩deep compression方法:网络剪枝、量化、哈弗曼编码、知识蒸馏 奇异值(SVD)分解 硬件加速器 低精度浮点数保存 轻量化模型优势: 在分布式训练中,与服务器通信需求小 参数少,从云端下载模型的数据量小 ...

Attention-Gated Networks for Improving Ultrasound Scan Plane Detection

code 1. Introduction AG-Sononet在Sononet的基础上加入注意力机制 Sononet介绍: Sononet是一个CNN架构,包含两个组件:特征提取模块和自适应模块。 在特征提取模块,利用VGG网络的前17层(包括Map pooling)提取判别特征 ...

Libra R-CNN Towards Balanced Learning for Object Detection

论文阅读

1. Introduction 检测性能主要受限于训练时sample level, feature level, objective level 的不平衡问题 所选的 region samples是否 representative 提取的 visual feature 是否充分利用 设计的目标函数是否...

Adversarial Autoencoders

论文阅读

1. Introduction 提出了对抗自编码器,其本质上是自动编码器和GAN架构的合体,通过将AE隐藏层编码向量的聚合后验与任意先验分布进行匹配完成变分推论(variational inference) 将聚合后验与先验匹配确保从该先验任何部分都能够生成有意义的样本 AAE的编码器将数据分布转换成特定先验分布;解码器可以看作一个深...

Efficient Neural Architecture Search via Parameter Sharing

论文阅读

1. Introduction 提出了一种高效的神经网络架构搜索方法(a fast and inexpensive approach ) 控制器通过在大型计算图内搜索最佳子图来发现最佳神经网络架构 2. Method ENAS的核心概念:神经网络架构的搜索空间可以表示成有向无环图(DAG) ...

Distilling the Knowledge in a Neural Network

论文阅读

1、Introduction 机器学习算法中一种简单的提高性能的方法是使用同样的数据集训练多个不同的模型,测试时取各自预测值的加权平均作为整个算法的最终输出结果。然而多个模型的集合体积庞大,且运算需求极大,难以部署在大量用户的机器上。 提出了一种知识蒸馏(Knowledge Distillation)方法,从大模型所学习到的知识中学习有用信息来训练小模型,并保证性...

Semantic Segmentation

Semantic Segmentation模型及损失函数总结

UNet-family U-Net [paper] : U-Net: Convolutional Networks for Biomedical Image Segmentation 根据 UNet的结构,它能够结合底层和高层的信息。 底层(深层)信息:经过多次下采样后的低分辨率信息。能够提供分割目标在整个图像中上下文语义信息,可理解为反应目标和它的环境之间关系的特征。这个...