【NLP】Seq2Seq | Beam Search

强化学习是机器学习的一个领域，它主要关注如何使智能体（Agent）在环境（Environment）中学会采取行动（Action）以最大化某种累积奖励（Reward）。强化学习与其他类型的机器学习（如监督学习和无监督学习）的主要区别在于，它不依赖于预先标记的输入/输出对，而是通过智能体与环境的交互来学习。以下是这些概念的详细介绍：

阅读全文 »

【NLP】时序模型与马尔可夫模型

发布于 2024-03-12 | 12分钟 | 3426字数

原理+论文+实战：60篇由浅入深的时间序列预测/分类教程汇总

时序模型

t 时刻的状态和前面的数据相关

阅读全文 »

【ML】Softmax

发布于 2024-03-11 | 标签: DL 、 ML | 2分钟 | 536字数

Softmax 函数如上图所示，分子 xi 是每个数据的值，将其指数化，将输出的数值拉开距离。分母是所有数据指数之和，这是一种概率形式，表达为样本占所有值的概率。
它可以用作 Softmax 回归、Softmax 激活函数在神经网络中往往用在最后一层，特别是在处理分类问题时，将网络的原始输出转换为更直观的概率形式。

阅读全文 »

【DL】Transformer

发布于 2024-03-11 | 标签: DL 、 CV 、 NLP 、 ML | 5分钟 | 1271字数

【Transformer模型】曼妙动画轻松学，形象比喻贼好记
 超强动画，一步一步深入浅出解释Transformer原理！
68 Transformer【动手学深度学习v2】

阅读全文 »

【DL】模型复用

发布于 2024-03-10 | 标签: DL | 6分钟 | 1611字数

模型复用，通常在机器学习和深度学习领域称为迁移学习（Transfer Learning），是一种非常有效的方法，可以将在一个任务上训练好的模型应用到另一个相关但不同的任务上。这种方法特别有用，因为从头开始训练一个复杂模型通常需要大量的计算资源和大量的标记数据，而这两者在很多情况下都是昂贵或难以获得的。

Fine Tuning

模型复用的基本思想

阅读全文 »

【ML】分类和回归

发布于 2024-03-10 | 标签: ML | 17分钟 | 4990字数

分类

目标变量：分类任务中的目标变量是离散的，也就是说，它将输入数据映射到预定义的类别或标签中。这些类别通常是有限的且不连续的。

阅读全文 »