人工智能行业洞察(2025.12.13-2025.12.19)
1.宇树科技发布人形机器人“App Store”
宇树科技宣布首发人形机器人“App Store”,用户可以将训练好的舞蹈、武术、干活等模型一键上传分享,也可以下载其他开发者开发的动作部署到机器人。(36氪)
2.OpenAI前CTO再创业,新产品Tinker宣布接入Kimi K2 Thinking
前OpenAI首席技术官Mira Murat离职后,率一批OpenAI旧将创办Thinking Machines Lab,据多家媒体报道,最新估值将达500亿美元。Mira Murat日前发文介绍,首款产品Tinker已正式全面开放,并新增万亿参数级推理模型Kimi K2 Thinking。(36氪)3.英伟达发布Nemotron 3系列开源模型12月15日,英伟达发布Nemotron 3家族开源模型,包括Nano/Super/Ultra版本,该模型引入混合型Mamba-Transformer专家混合架构。(界面新闻)4.Canva可画正式向中国市场推出对话式AI助手
视觉设计平台Canva可画在年度分享会上,正式向中国市场推出对话式AI助手Canva AI。该产品以“对话启动、边聊边改”为核心,将设计流程简化为自然对话。用户只需描述想法,即可生成可编辑的初稿,并通过口语化指令实时调整,降低操作门槛。(36氪)5.DreamTech正式发布新一代基础模型架构Neural4D-2.5
近日,在2025深圳全球招商大会人工智能与机器人主题活动上,AI创业企业DreamTech正式发布其新一代基础模型架构Neural4D-2.5。据了解,Neural4D-2.5架构采用了“原生3D贴图与感知一体化”技术,该技术通过百万级Token的超长上下文理解能力,拓展了AI模型的认知边界。(36氪)6.罗福莉完成入职后的小米首秀,正式发布和开源最新MoE大模型MiMo-V2-Flash
12月17日上午,在小米2025小米人车家全生态合作伙伴大会上,Xiaomi MiMO大模型负责人罗福莉完成入职后的小米首秀,并正式发布和开源最新MoE大模型MiMo-V2-Flash。罗福莉表示,该模型具备超强基座模型潜能,在世界级评估榜单中排到了全球开源模型的TOP2,具备低成本高速度的特点,其成本在低于DeepseekV3.2的情况下,推理速度是其3倍。罗福莉被誉为“95后AI才女”,曾入职阿里达摩院,后任职幻方量化、DeepSeek并成为DeepSeek-V2关键开发者。2025年11月起罗福莉担任小米MiMo大模型团队负责人。(财联社)7.Gemini 3 Flash正式发布
12月18日,Gemini 3 Flash正式发布,Gemini 3家族成为完全体:Flash、Pro和Deep Think。Flash模型已经全面上线Gemini APP、AI Studio、Google Antigravity和Gemini CLI,用户打开Gemini就是默认Gemini 3 Flash版本。(新智元)8.字节跳动Seedance 1.5 pro音视频创作模型正式发布
字节跳动Seed团队12月17日正式发布新一代音视频创作模型Seedance 1.5 pro。Seedance 1.5 pro支持音视频联合生成,能够执行多种任务,包括从文本到音视频的合成以及图像引导的音视频生成等。(36氪)9.微软或将与Kimi进行Agent级合作实现Office产品自动化
在本月初微软Azure宣布接入Kimi k2模型后,双方合作有望下探至应用层。微软或将在本月与Kimi合作上线新的Agent功能,以应对本土厂商的激烈竞争。据了解,该合作将利用AI的Agent能力,实现Office产品的自动化。截至发稿,双方未予回应。(财联社)10.OpenAI与美国高校密集合作
OpenAI勉强在许多美国高校站稳脚跟,暂时克服了大学管理层对人工智能的戒心,其最终目标是使ChatGPT在成为下一代职场人士常用助手。根据采购订单,OpenAI向约35所公立大学出售了超过70万份ChatGPT许可,供学生和教职员工使用。相比之下,通常将其Copilot助手与现有软件捆绑的微软,其AI工具在这些学校的普及速度更为平缓,而且教师的使用率往往高于学生。(新浪财经)11.豆包大模型1.8发布,Seedance模型同步升级
在今天召开的火山引擎Force原动力大会上,字节跳动正式发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro。评测数据显示,豆包模型家族在多模态理解和生成能力、Agent能力上,已达到业界领先水平。(36氪)12.美团发布并开源SOTA级虚拟人视频生成模型LongCat-Video-Avatar
美团LongCat团队正式发布并开源SOTA级虚拟人视频生成模型——LongCat-Video-Avatar。该模型基于LongCat-Video基座打造,延续“一个模型支持多任务”的核心设计,原生支持Audio-Text-to-Video(AT2V)、Audio-Text-Image-to-Video(ATI2V)及视频续写等核心功能,同时在底层架构上全面升级,实现动作拟真度、长视频稳定性与身份一致性三大维度的突破。(36氪)文婷律师系华商律师事务所高级合伙人、深圳市律师协会区块链法律专业委员会主任、深圳市律师协会人工智能法律服务团副团长、广东省律师协会跨境投资专业委员会秘书长、华商数字经济法律研究院创始院长、华商区块链法律研究院创始院长,深圳数据交易所首批数据交易合规官(DEXCO)、香港RWA全球产业联盟法律合规委副主任,深圳市区块链技术应用协会法律服务专业委员会主任。
文婷律师团队执业的范围包括但不限于公司运营与合规、投融资、并购重组、IPO上市,在行业方面,文婷律师团队自2016年垂直研究区块链、元宇宙、Web3.0、人工智能等领域,在该领域积累了丰富的法律服务经验及能力。
联系文婷律师团队请发电邮至rxl@huashang.cn