一、大公司动态
1、小米AI大模型MiLM-6B首次曝光:64亿参数量
8月11日,小米公司开发的大规模预训练语言模型 MiLM-6B/1.3B登陆代码托管平台GitHub,参数规模最高达64亿,而且现身在C-Eval、CMMLU基准评测榜单。
截至当前,小米大模型MiLM-6B在C-Eval总榜单排名第10、同参数量级排名第1,平均分为60.2分,超过了阿里云Qwen-7B、OpenAI研发的ChatGPT(今年5月数据)等,而MiLM-1.3B排行第30名,平均分45.8分,接近谷歌投资的Anthropic公司的Claude 1.0版本大模型。
2、阿里达摩院免费开放100件AI专利许可
在浙江省专利公开实施政策公布会上,阿里达摩院(湖畔实验室)宣布向社会免费开放100件AI专利许可,这将成为中国人工智能规模最大的一次专利开放行动。
据介绍,阿里达摩院此次免费开放100件AI专利许可,将被纳入全国首批专利公开实施清单,在浙江知识产权交易中心上架,覆盖了图像技术、视频技术、3D视觉等诸多AI技术领域,不乏“交通信号灯感知”“疑似侵权图片检测”、“时序数据预测”、“点云数据处理”“智能字幕生成”等富有广阔应用场景的专利。让中小微企业以较低成本甚至零成本获得AI技术红利,加速AI时代的到来。
二、初创公司动态
1、Anthropic发布改进版入门级AI模型Claude Instant 1.2
Anthropic日前发布了改进版的入门级文本生成 AI 模型 Claude Instant1.2。新版本融合了 Anthropic 最近发布的 Claude2的优势,在数学、编码、推理和安全等领域取得了显着进步。内部测试显示,Claude Instant1.2在编码基准测试中的得分比1.1版本高出近6个百分点,并且在一组数学问题上的得分也有所提升。
Anthropic 表示,Claude Instant1.2生成的回复更长、更结构化,并且更好地遵循格式说明,还在引文提取、多语言功能和问题解答方面有改进。此外,Anthropic 声称 Claude Instant1.2更能抵抗幻觉和越狱尝试。幻觉是指模型生成不正确或无意义的文本,而越狱是一种绕过大型语言模型上设置的安全功能的技术。
新版本还增加了与Claude2相同大小的上下文窗口,可以分析约75,000个词的文本。具有大上下文窗口的模型更不容易 “忘记” 最近对话的内容。虽然 Anthropic 的目标是开发下一代 AI 自主学习算法,但 Claude Instant 1.2并不是这个算法,它更多是与OpenAI和其他初创公司竞争的入门级产品。

2、灯塔上线票房预测功能,以AI大模型赋力宣发数据准确性
一站式宣发平台灯塔正式推出票房预测功能,基于大模型框架,对影片“T+1”日票房和总票房进行科学测算。该功能依托AI大模型完成深度学习,将票房预测准确性提升至业内新阶段。据悉,这是电影行业内首个基于AI大模型构建的票房预测产品。
灯塔认为,无论是灯塔票房预测还是市场上其他的预测产品,其实更像是一个“推测产品”。它不具备先知先觉的预测能力。对于片方和宣发方来说,票房预测数据提供了一个很好的实时观测维度。例如,“T+1”日票房的预测结果直接反映着宣发策略的有效性,宣发团队据此可以发现问题并及时纠偏。同时,为了持续提升票房预测的准确性,灯塔面向全行业发起邀约,通过算法开源,吸引更多算法专家一起加入,将科技进步的成果更多地引入电影宣发场景,助力电影宣发的效率提升。此外,灯塔还将进一步提升测算机制的透明化,以更公开公正的方式服务行业。
三、投融资
1、ARM即将上市,IPO估值或达600亿
Arm计划今年9月初在美国纳斯达克上市,估值约为600亿美元,现正寻求筹资80亿到100亿美元。今年5月,Arm就已向美国证券交易委员会(SEC)提交首次公开发行股票的申请,据悉软银将于本月晚些时候正式申请在纳斯达克上市。
Arm总部设在英国剑桥,是英国为数不多居于全球领导地位的技术公司,此前英国方面也一直游说,希望在伦敦交易所上市。不过今年早些时候,Arm拒绝了英国这边,并表示将寻求在美国证交所上市,但不排除在伦敦上市的可能性。
如果上市顺利,Arm将是自2014年阿里巴巴和2012年Meta上市以来,科技行业最大规模的一次IPO。目前,Arm公司75%的股份由软银集团持有,其余25%的股份由软银愿景基金持有。此次上市,愿景基金计划在公开市场出售10%-15%的股份。
Arm其掌握的各种芯片架构设计专利,俨然与x86和RISC-V组成架构三霸,客户包括多数半导体厂商,比如英特尔、AMD、英伟达和高通等。而Arm作为软银旗下最挣钱的业务之一,此前发布第三财季(截至2022年12月底)显示上季度总营收达到7.46亿美元,同比增长28%。
四、延伸阅读
1、安徽省人工智能主题母基金首支子基金落地
安徽省人工智能主题母基金首支子基金--和生星图空天智能创业投资基金完成工商注册,正式落地中安创谷科技园“科大硅谷”风投创投街区。
该基金由方正和生投资有限责任公司管理,并联合中安创谷科技园入驻企业中科星图数字地球合肥有限公司的母公司中科星图 (股票代码: 688568)共同设立,该基金总规模 20 亿元,专注于投资空天信息及人工智能领域的高成长企业。下一步, 中安创谷公司将协同该基金,深度发掘和招引行业优质企业,形成产业赋能和协同,共同助力安徽省空天信息及人工智能产业高质量发展。
2、谷歌发现大模型「领悟」现象
哪怕只有几十个神经元,AI也能出现泛化能力!这是几个谷歌科学家在搞正经研究时,“不经意间”发现的新成果。他们给一些很简单的AI模型“照了个X光”——将它们的训练过程可视化后,发现了有意思的现象:随着训练时间增加,一些AI会从“死记硬背”的状态中脱离出来,进化出“领悟力”(grokking),对没见过的数据表现出概括能力。
科学家们先探讨了AI出现“领悟力”(grokking)的过程和契机,发现了两个现象:一、虽然训练时loss会突然下降,但“领悟”并不是突然发生的,它是一个平滑的变化过程。二、并非所有AI都能学会“领悟”。科学家们训练了1125个模型,其中模型之间的超参数不同,每组超参数训练9个模型。
最后归纳出4类模型,只有2类模型会出现“领悟力”。总结概括规律就是,一旦权重衰减、模型大小、数据量和超参数的设置不合适,AI的“领悟力”就有可能消失——以权重衰减为例。如果权重衰减太小,会导致模型过拟合;权重衰减太大,又会导致模型学不到任何东西。
——End——
如果你对AI、机器人的技术、创业、投资感兴趣,欢迎找我聊聊:
微信:VCPirlo
讨论群:风投十年-AI+机器人



