LLM-RL-LSPS

SLINVIT 算法在光度立体法三维重建任务中的光照规划实现流程

  1. 阅读全文 »

【读论文】How Can LLM Guide RL? A Value-Based Approach

code

让RL用少量样本数据就能学好

我们开发了一种名为LINVIT的算法,该算法将LLM的指导作为基于值的RL中的正则化因子,从而显著减少了学习所需的数据量,特别是在理想策略与LLM提供的策略之间的差异较小时,这表明初始策略接近最优,减少了对进一步探索的需求。此外,我们提出了一种实用的算法SLINVIT,它简化了值函数的构建,并通过使用子目标来降低搜索复杂度。

阅读全文 »

【读论文】AIR-Embodied

AIR-Embodied: An Efficient Active 3DGS-based Interaction and
Reconstruction Framework with Embodied Large Language Model

这篇文章对标的方法主要是传统的**Next Best View (NBV)**规划方法和基于学习的方法。现有方法的缺点包括:

阅读全文 »

【读论文】NeRF++

《NERF++: 分析与改进神经辐射场》旨在对标现有的 NeRF 方法,并提出改进方案以解决 NeRF 在处理大尺度、无界 3D 场景时的不足。现有 NeRF 方法主要用于生成高质量的视图合成,尽管它在各种捕捉设置(包括 360 度和正前方捕捉)中表现良好,但存在一些关键缺点:

现有方法的缺点:

**形状-辐射模糊问题:**NeRF 依赖 5D 函数(3D 坐标加 2D 视角方向)来模拟物体的形状和辐射场,但这种函数在没有正则化的情况下容易产生退化解,即通过错误的几何形状仍能完美拟合训练图像,却无法推广到新视角。

阅读全文 »