推广 热搜: 采购方式  滤芯  带式称重给煤机  甲带  气动隔膜泵  减速机型号  无级变速机  链式给煤机  履带  减速机 

AI检察研究进度小汇报

   日期:2026-02-10 19:44:01     来源:网络整理    作者:本站编辑    评论:0    
AI检察研究进度小汇报
终于决定还是开个号记录一下初步与AI检察结识的过程
主要是记录一些已经有初步成果的试验和遇到阻碍可以讨论的技术或法律问题,以及如果有技术同仁已经探索实践过的项目可以交流下也算避免重复建设,可以只用来研究。
首先明确,像文书生成、三书比对等在2.0平台已经明确由总公司牵头的项目咱们只了解技术路线,就不做深入研究了。
然后说明我们实验室目前的硬件是一台AMD AI MAX 395以及2卡共64G显存算力。
介绍一下本人信息自动化和人工智能专业,贺妈认证,致力于检察产线自动化研究
介绍一下近期成果:
使用qwen3完成了对某类文字版文书的多监督点的判断筛查
研究内容:qwen3大模型部署 ROCm兼容测试 8b和30b的性能效果对比Temperature/Top-p/repetition_penalty/Max Tokens等参数的设置影响
使用qwen3-vl完成对电子卷宗的多监督点的判断筛查,增加了可随时增删改查的监督点知识库 按照监督点的
研究内容:多模态模型接口 yaml格式知识库 8b和30b的性能效果对比 fastapi部署
使用qwen3-vl-embedding完成聊天记录向量化,可通过语义查询聊天内容、图片、语音并溯源
研究内容:chunk_size动态设置  chroma向量数据库 embedding和reranker过程 微信语音amr的特殊编码格式 多条件检索
这个目前卡在了图像的语义文字对齐阶段,使用图像与生成图像的文字进行相似度计算才0.3+,还没核查到问题在哪,初步感觉可能拿这段文字和其他的图片计算相似度会更低就对了
这两天在研究Agent Skill模式分析不同罪名,根据罪名分别调用Skill,初步探索,感觉这部分内容应该由总公司研究统一发布Skill或标准给大家用。
还有一个案件卷宗整体向量化的研究,每一页都通过VL-embedding向量化,具体内容写入元数据,根据需求召回,但是大模型的上下文限制越来越大,自动化批处理的案件一般不是什么疑难复杂案件,就先不做案件本身的向量化了。其实本来是想把案件整体通过编码向量化之后能计算案件之间的相似度的
目前还没学习完,3天一个新模型和5天一个技术,更新太快了,能找到匹配业务流程最合适的模型和技术就好
(工作繁忙,更新频率不定)
 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON