中国电信研究院工作日志

2022.7.12

-什么是 CV
(Computer Vision)
-什么是 CVPR
IEEE Conference on Computer Vision and Pattern Recognition
IEEE 国际计算机视觉与模式识别会议
该会议是由IEEE举办的一年一度的计算机视觉和模式识别领域的顶级会议
CVPR 的论文数逐年递增

CVPR 网址:https://cvpr【year】.thecvf.com/
【year】代表会议的年份

CVPR 入门1

历年 CVPR 的 workshop URL
https://cvpr2017.thecvf.com/program/workshops
https://cvpr2018.thecvf.com/program/workshops
https://cvpr2019.thecvf.com/program/workshops
https://cvpr2020.thecvf.com/workshops-schedule
https://cvpr2021.thecvf.com/workshops-schedule
https://cvpr2022.thecvf.com/workshop-schedule

2022.7.13

workshop:研讨会,比 conference 难度低一些
DBLP(DataBase systems and Logic Programming)是计算机领域内对研究的成果以作者为核心的一个计算机类英文文献的集成数据库系统。

其他类似的机构的 workshop

一些 AI 顶会

AAAI
国际先进人工智能协会(Association for the Advancement of Artificial Intelligence, AAAI)

NeurIPS
神经信息处理系统大会(Conference and Workshop on Neural Information Processing Systems) 关于机器学习和计算神经科学的国际会议

ACL
(The Association for Computational Linguistics)计算语言学年会,由计算语言学学会(Association of Computational Linguistics)举办;ACL 是自然语言处理领域水平最高、最权威的国际会议

**ICML **
International Conference on Machine Learning,即国际机器学习大会。ICML如今已发展为由国际机器学习学会(IMLS)主办的年度机器学习国际顶级会议。

IJCAI
国际人工智能联合会议(International Joint Conference on Artificial Intelligence, 简称为IJCAI)是人工智能领域中最主要的学术会议之一

ICCV
全称是 IEEE International Conference on Computer Vision,即国际计算机视觉大会,由IEEE主办,与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会议

2022.7.14

调研各个顶会网站的项目内容,统计热门技术分类,进行难易程度排序
思路:先统计大标题,对大标题进行上述分析

2022.7.18

标注陌生名词,明显很复杂的/表意模糊的标完先放那,指向性明显的查出意思

2022.7.19

CVPR 关键词调研
多模态学习是多个模态融合学习
细粒度图像分类:
在区分出基本类别的基础上,进行更精细的子类划分,如区分鸟的种类、车的款式、狗的品种等
长视频理解:识别视频内容
神经架构搜索 NAS
合成数据:人工合成数据用于机器学习

图像压缩算法
情感分析
细粒度视觉 参考代码

2022.7.20

王老师给定方向:
入门课题1:
细粒度分类

入门课题2:
常规的检测识别姿态人脸
GAN 生成对抗网络

入门课题3:
高级应用

细粒度分类
细粒度图像分类模型加实战代码
深度学习: 细粒度图像分类
细粒度分类,比赛,和相关模型介绍
基于Pytorch细粒度分类实战

精细化分类
识别出物体的大类别(比如:计算机、手机、水杯等)较易,但如果进一步去判断更为精细化的物体分类名称,则难度极大。最大的挑战在于,同一大类别下 不同 子类别 间的 视觉差异 极小。因此,精细化分类 所需的图像分辨率 较高。

一般步骤:
首先找到前景对象(鸟)及其局部区域(头、脚、翅膀等), 之后分别对这些区
域提取特征. 对所得到的特征进行适当的处理之后, 用来完成分类器的训练
和预测

细粒度图像分类模型分类:
(1)强监督模型: 需要类别以外的标签进行监督
Part-based R-CNN 区域卷积神经网络
Pose-normalized CNN
Multi-proposal Net MT-CNN
(2)弱监督模型: 不需要类别以外的标签
图像过滤
Multi-Attention MA-CNN
双线性卷积神经网络结构(Bilinear CNN)

2022.7.21

调研细粒度视觉获奖代码

CVPR 2020 细粒度分类挑战赛冠军方案:数据增强+知识蒸馏,效果大幅提升

2019CVPR细粒度论文笔记《Destruction and Construction Learning for Fine-grained Image Recognition》

2022.7.22

AAAI 关键词调研
强化学习:
试错,用错误调整参数。环境会返回给系统一个正确/错误的信号,用于调整参数

进化神经网络(evolutionary neural networks,ENN)
是基于 进化 计算和神经网络两大智能分支,将二者有机融合在一起产生的一种全新 神经网络模型

细粒度图像分类:
在区分出基本类别的基础上,进行更精细的子类划分,如区分鸟的种类、车的款式、狗的品种等

分类置信度:
分类置信度confidence是介于0和1 (或100%)之间的数字,它描述模型认为此预测边界框包含某类别目标的概率

集成学习 Ensemble Learning:
组合这里的多个弱监督模型以期得到一个更好更全面的强监督模型,集成学习潜在的思想是即便某一个弱分类器得到了错误的预测,其他的弱分类器也可以将错误纠正回来

2022.7.25

ACL 关键词调研 和 NeurlPS 关键词调研
细粒度文本分类

合成泛化:
在机器学习的背景下,合成泛化(compositional generalization)是指机器学习从一组训练示例学习上下文表示。

2022.7.26

ICML 顶会的关键词调研

我的选择:

  1. CNN
  2. 强化学习
  3. NLP 文本情感分析
  4. 细粒度分类
  5. AI 安全

2022 - Snack 物种识别论文方法阅读

第一名使用方法解读:
VAN (Visual Attention Network) 视觉注意力网络
CoAtNet 结合卷积和注意力
label smoothing 标签平滑 1
label smoothing 标签平滑 2

第二名使用方法解读:
Vision Transformer(ViT)

赞赏