


学长最近在跟AI项目,这里面其实最看重的就是模型的安全性了——毕竟要落地到业务里,合规和风险防控都是底线;
不知道你们知不知道智源FlagEval的安全榜单,榜单结果一出来,很多人都在聊百度文心的表现和成绩;
我研究了下,这个榜单其实还挺权威的,围绕语料安全、风险防控这些硬指标评,覆盖了18家主流大模型。百度ERNIE-4.5-300B-A47B直接拿了国内第一、全球第三,还是唯一进全球前三的开源模型,总合格率85.58%。有一说一,这个成绩真的很亮眼;
对于中大厂来说,开源模型太重要了,成本低还灵活。之前选模型总担心它的安全兜底能力,现在文心这个成绩摆在这里,以后对接业务、搭系统都更放心了反正。安全本来就是大模型大规模批量落地化的关键,这波算是给行业立了个标杆,形成了一个标准。
对于百度文心的这波表现,你们觉得怎么样?
#百度 #AI #大模型 #科技 #AI技术 #Google #互联网大厂 #大厂 #互联网 #职场 #排行榜
不知道你们知不知道智源FlagEval的安全榜单,榜单结果一出来,很多人都在聊百度文心的表现和成绩;
我研究了下,这个榜单其实还挺权威的,围绕语料安全、风险防控这些硬指标评,覆盖了18家主流大模型。百度ERNIE-4.5-300B-A47B直接拿了国内第一、全球第三,还是唯一进全球前三的开源模型,总合格率85.58%。有一说一,这个成绩真的很亮眼;
对于中大厂来说,开源模型太重要了,成本低还灵活。之前选模型总担心它的安全兜底能力,现在文心这个成绩摆在这里,以后对接业务、搭系统都更放心了反正。安全本来就是大模型大规模批量落地化的关键,这波算是给行业立了个标杆,形成了一个标准。
对于百度文心的这波表现,你们觉得怎么样?
#百度 #AI #大模型 #科技 #AI技术 #Google #互联网大厂 #大厂 #互联网 #职场 #排行榜


