推广 热搜： 采购方式滤芯带式称重给煤机甲带气动隔膜泵减速机型号无级变速机链式给煤机履带减速机

Trove内存降低2.6倍

日期：2025-11-11 07:12:58 来源：网络整理作者：本站编辑评论：0

Trove内存降低2.6倍

? 布朗大学团队推出Trove：首个支持实时数据处理的开源检索工具包，显著降低内存消耗2.6倍并简化分布式实验流程
? 问题定义：
1️⃣ 传统检索工具包依赖预处理数据文件，大量重复存储导致实验灵活性差且难以追踪数据变更。
2️⃣ 模型定制受限于固定框架，无法直接访问编码器或灵活修改损失函数等组件。
3️⃣ 分布式评估需手动拆分数据并多次运行脚本，无法无缝扩展多节点计算资源。
4️⃣ 不同数据集或增强数据（如合成样本）难以动态组合，需编写复杂代码适配新配置。
? 方法概述：
Trove通过MaterializedQRel结构优化数据加载，实时关联查询、文档与相关性标签，仅按需加载必要数据降低内存占用。其模块化设计允许用户直接替换任意组件（如编码器、损失函数），并保持与Hugging Face生态兼容。分布式推理统一接口可自动分配任务到多GPU节点，无需修改代码。提供预处理配置接口（如过滤查询、标签重映射）
? 实验结果：
1️⃣ 内存优化：通过按需加载数据和Apache Arrow内存映射技术，Trove将内存消耗降低至传统方法的1/2.6。
2️⃣ 分布式加速：多节点推理时，系统性能与节点数线性增长（如增加2个GPU时推理时间减半）。
3️⃣ 配置效率：实验显示动态组合不同数据集（如同时使用真实和合成数据）的配置代码从传统方案的120行缩减至8行。
? 技术亮点及关键创新：
- 仅加载必要数据的MaterializedQRel结构，首次实现实时数据处理与内存占用控制。
- 模块化架构允许用户完全覆盖或替换任意组件（如自定义编码器微调策略），突破现有框架的硬编码限制。
- 统一的分布式推理接口，自动划分数据编码、检索和指标计算任务，无需手动管理进程间通信。
- 预处理管道与版本控制系统无缝集成，支持可重复的实验配置变更记录。
? 技术意义：
显著降低检索模型研究门槛，加速新数据增强策略实验（如合成数据混合训练），支持快速迭代个性化模型架构。其分布式设计为大规模工业级系统提供了高扩展性方案
? 研究团队：布朗大学计算机科学系团队，在信息检索和机器学习工具链领域持续深耕多年
? 论文链接：https://arxiv.org/pdf/2511.01857.pdf
? 项目主页：https://ir-trove.dev

打赏

更多>同类资讯

0 条相关评论

推荐图文

推荐资讯

点击排行