2026-05-19 04:39:03 7846次浏览

作者 | 周一笑邮箱 | zhouyixiao@pingwest.com

原本预计在 2026 年春节上演的中国 AI 大戏,延迟到了五一假期前。

这周五,DeepSeek V4 千呼万唤始出来。

同样在这周,Qwen、Kimi、小米、腾讯都不约而同拿出了自己最新的代表作。

从 Artificial Analysis 最新放榜的开源模型智能指数看,开源模型的前几名已经都是中国模型。

其中,TOP2 都是这周发布的。他们也是这几天 OpenRouter 真实调用量上挤入全球 TOP5 的两家公司。

这已经不是 DeepSeek 和 Kimi 这么默契了。往回看看前面几次。

2025 年 1 月,DeepSeek R1 和 Kimi K1.5 前后两个小时内发布,都把目标指向 OpenAI o1。

一个月后,DeepSeek NSA 和 Kimi MoBA 几乎同时出现,都在改造 Transformer 最核心的注意力机制。

2025 年 4 月,Kimi 的 Kimina Prover Preview 和 DeepSeek-Prover-V2 先后发布,都在向形式化数学推理和定理证明方向推进。

时隔一年,现在,又一次,Kimi K2.6 和 DeepSeek V4 在同一周先后发布,两个万亿参数的开源模型,前后脚摆到了桌面上。

发力相同的技术方向,几乎同时到达同一个路口。这已经不像巧合了。

1

这次又撞了什么

先看这一轮各自拿出了什么。

DeepSeek V4 是一个 1.6 万亿参数的 MoE 模型,49B 激活参数,原生支持 100 万 token 上下文。它的核心叙事是效率革命,相比上一代 V3.2,单 token 推理算力需求下降了 73%,KV cache 压缩到原来的十分之一。

简单说,同样的硬件能处理多得多的请求,同样长度的文本花的钱少得多。

与此同时,V4 完成了对华为昇腾芯片的深度适配,从英伟达 CUDA 生态向华为 CANN 架构做了底层代码迁移,也让这一轮发布多了一层国产算力迁移的意味。

Kimi K2.6 是一个万亿参数的 MoE 多模态模型,32B 激活参数,256K 上下文。它的核心叙事不是更大或更便宜,而是更持久。

在测试中,K2.6 可以不间断编码 13 小时,处理超过 4000 次工具调用,修改 4000 多行代码,完成一个接近性能极限的开源金融撮合引擎的深度重构。

这不是普通的“代码能力提升”,而是在测试模型能不能从一次性回答,进入长时间、多工具、多 Agent 协作的工作状态。

K2.6 还引入了 Agent 集群架构,支持 300 个子 Agent 并行协作。月之暗面的 RL 基础设施团队已经用 K2.6 驱动的 Agent 连续自主运行了 5 天,负责监控、故障响应和系统运维。

它们总在同一个路口相遇,但开出去的方向并不一样。至少在这一轮,一个更像是在重写模型基础设施的成本结构,另一个更像是在验证模型能否进入更长周期的真实任务。方向不同,但在同一周发布这件事本身,已经足够让人截图发群了。

但两家也有高度一致的选择,万亿参数的 MoE 架构、开源、继续相信 Scaling Law。截至目前,它们也是中国仅有的两个已开源的万亿参数模型。

1

比撞车更有意思的事

多次撞车是一个好段子,但它背后有一个更值得注意的现象,两家的技术路线正在相互启发。

上一次,是 Kimi K2 借鉴了 DeepSeek V3 带火的 MLA 注意力机制。MLA 是一种压缩注意力计算和 KV 缓存以提升效率的方案,DeepSeek V3 让它成为中国开源模型技术栈里的显性选项。

这一次,是 DeepSeek V4 把 Muon 优化器作为模型架构层的三大更新之一。Muon 是一种二阶优化器,解决的是训练阶段参数更新的效率和稳定性问题,用来取代已经用了 10 年的 Adam。Kimi 是最早把 Muon 系优化器推到万亿参数级训练并系统公开经验的团队之一,杨植麟在 GTC 2026 演讲中称其可以带来 2 倍的 token 效率提升。而 V4 也跟进使用 Muon 优化器,用来提升收敛效率和训练稳定性。

换句话说,MLA 省的是推理时的钱,Muon 省的是训练时的路。而这两条路,已经在两家之间来回走了一遍。

这就让“撞车”不再只是发布时间上的巧合,而变成了技术栈层面的回声。更像是两家公司一边竞争,一边把对方探索过的技术思路变成自己下一轮实验的参考坐标。

这种相互启发还在继续延伸。在注意力机制上,DeepSeek 探索的是稀疏注意力,Kimi 下一代模型探索的是线性注意力,路径不同但要回答的问题一致,都是长上下文怎么不被全注意力的计算复杂度拖垮。

在残差连接上,DeepSeek 做 mHC,Kimi 做注意力残差,同样是不同方案指向同一个目标,让模型变深之后训练依然稳定。

这件事之所以值得说,是因为放在更大的行业背景里看,它其实是反常的。硅谷头部公司正在变得越来越封闭,OpenAI 早已不再公开训练细节,Anthropic 和 Google 的核心方法同样讳莫如深,社区只能靠猜测和拼凑来推断它们的技术路线。连在舞台上握手都不太可能了

而在 Kimi 和 DeepSeek 之间,技术报告和开源代码的可见度让技术扩散的链条明显缩短了。多次撞车之所以能被看到、被讨论、被放在一起比较,前提恰恰是两家都选择了把东西摊在桌面上。

中国开源模型的技术扩散速度,正在变得比过去快得多。这可能才是频繁撞车真正说明的事情。

1

全球技术圈都在看它们撞车

这种“撞车”的叙事,最早当然是中文科技圈的发明。但海外开发者社区也在用自己的方式确认这件事。

K2.6 发布后,AI 领域最有影响力的 newsletter 之一 Latent Space 直接把 Kimi 放进了“DeepSeek 沉默期后中国开源模型实验室领跑者”的位置。几天后 V4 发布,海外开发者社区又立刻把 V4、K2.6、GLM 5.1 放到同一张表格里比较参数、价格、上下文长度和 Agent 能力。

英伟达 GTC 2026 上用来展示下一代芯片推理性能的中国模型,是这两家。

在海外开发者社区里,当人们讨论中国开源模型时,Kimi 和 DeepSeek 的确越来越频繁地被放进同一张表里。

1

它们撞上的不是彼此

这也让 DeepSeek 和 Kimi 的关系变得有点微妙。它们当然是竞争对手,但在更大的模型生态里,又共同把中国开源模型推到了一个更难被忽视的位置。

它们对闭源模型的压力,不只来自某一次 benchmark,而来自成本、可部署性、开源权重和技术扩散速度这些更慢、更底层的变量。

所以,Kimi 到底有没有在故意撞车 DeepSeek?

大概率没有。万亿参数的 MoE 要做,长上下文的注意力机制要改,训练效率的优化器要换,国产芯片的适配要啃,开源要开得真诚而不是做防御性姿态。这些不是“选项”,而是“必经之路”。

两家公司都在认真地做底层技术,也都选择把关键进展放到公开语境里,于是就一次又一次地在同一个十字路口碰面。

不是它们太默契,是路太窄了。

至于下一次“撞车”,大概已经在路上了。

如果没猜错的话,Kimi 让大模型的文本和视觉能力齐头并进的技术方案,将启发更多中国开源纯文本模型长出“眼睛”,一起看到更远、更大的世界。

点个“爱心”,再走 吧

在当前的网络文化中,"男男公调"这一词汇逐渐成为热门话题。它不仅代表着一种独特的文化现象,更涉及到了剧情、表演、情感等多重元素。本文将围绕这一主题,为大家详细解析《男男公调》这部大型响声剧情全集,并免费提供在线观看资源。 首先,让买球来了解一下《男男公调》这部作品。它是一部以男性为主角,讲述了一段充满激情与挑战的爱情故事。故事背景设定在一个充满挑战与机遇的时代,主人公们在这个时代背景下,经历了种种磨难,最终收获了真挚的爱情。 在剧情方面,《男男公调》以其独特的叙事手法和丰富的情感表达,吸引了众多观众。剧中,主人公们之间的情感纠葛,以及他们在面对困境时的勇敢与坚持,都让观众为之动容。此外,剧中的场景布置、服装道具等细节,也展现了制作团队的用心。 接下来,让买球来探讨一下《男男公调》中的“大型响声”。这里的“大型响声”并非字面意义上的声音,而是指剧中角色在情感爆发时所表现出的强烈情绪。这种情绪的传递,使得剧情更加生动,让观众仿佛置身其中。 在观看《男男公调》的过程中,买球不禁会思考:是什么让这些男性角色在爱情面前如此勇敢?答案是:爱情的力量。在剧中,主人公们为了爱情,可以放弃一切,甚至不惜付出生命的代价。这种对爱情的执着与追求,让人感动。 值得一提的是,《男男公调》的全集免费播放,让更多观众有机会欣赏这部优秀作品。以下是观看《男男公调》全集的免费资源链接: [此处插入HTML代码] 在观看过程中,观众不仅可以感受到剧情的紧张刺激,还可以领略到演员们的出色表演。剧中的角色形象鲜明,个性鲜明,让人过目难忘。 此外,《男男公调》在情感表达方面也颇具特色。剧中,主人公们在面对爱情、友情、亲情等情感时,表现出了不同的态度和选择。这种多元的情感表达,让观众在欣赏剧情的同时,也能从中得到启示。 总之,《男男公调》这部大型响声剧情全集,以其独特的叙事手法、丰富的情感表达和出色的演员阵容,赢得了观众的喜爱。在享受这部作品的同时,买球也要珍惜生活中的每一次感动,勇敢地去追求自己的爱情。 最后,再次提醒大家,观看《男男公调》全集的免费资源链接如下: [此处插入HTML代码]


《男男公调:大型响声剧情全集免费在线观看解析》,游戏中解锁很多隐藏任务,可以得到强力武器道具,帮助自己快速通关。 【哔哩哔哩】【bilibili】
16 个月后,DeepSeek 已不是孤身走暗巷
《男男公调:大型响声剧情全集免费在线观看解析》

/wanews/article/8105433.htm

「活动」首次登录送318积分

729.93MB
版本V2.28.58
下载《男男公调:大型响声剧情全集免费在线观看解析》安装你想要的应用 更方便 更快捷 发现更多
喜欢 48%好评(97人)
评论 89
详细信息
应用介绍
一.《男男公调:大型响声剧情全集免费在线观看解析》  男男play+被抱着c到高潮
二.小采看番  里番本子
三.黄色视频网站下载  老公喜欢我吃奶头
四.空姐的屁股撅起来让我吃  成人午夜免费做爱视频
五.麻豆成人传媒1区 2区 3区 4区  免费高清|国产|在线播放5178tv
六.黑人交配视频  最新eeuss排行榜第1页
七.国产男男体育生gay  秘密の入口官网通道
八.白洁色操  91n小视频

【联系买球】
客服热线:400-1288-1419
加载更多
版本更新
V.6.08.92
特朗普即将访华,白宫高官爆料:总统对华很友好,中国可以放心啦

《男男公调:大型响声剧情全集免费在线观看解析》类似软件

猜你喜欢

包含 饿了么 的应用集
评论
  • 豪掷631亿分红!券商板块修复行情底气何在?行业ROE进入上升通道 5天前
    英国最倒霉球迷,今年观赛利物浦6场全不胜+常去餐厅接连倒闭
  • 上海加强前沿制度研究,开展人工智能知识产权快速协同保护指南编制 9天前
    表面“劝赌” 暗中“拉客”,部分境外赌场通过短视频平台引流
  • “2026江苏·南京台湾周”开幕 两岸民俗大汇演精彩呈现 9天前
    孔蒂追逐萨里的纪录:马拉多纳球场渴望创纪录的一年
  • 解码“电影+”新生态 第十六届北影节投融资论坛举办 8天前
    停火前15分钟诡异大单!美伊停火背后,真正买单的人却被悄悄忽略
  • 国军新5军军长被俘虏后,为何沮丧地说买球没有前途? 9天前
    记者:委员会曾考虑追加马奎尔禁赛两场,综合考量后从轻处罚
  • 中信证券:估值性价比凸显,券商年内最优配置时点有望到来 8天前
    美伊在哪些问题上“拉扯”不断?
  • 伊朗进入最高战备,美伊这次真的没退路了 3天前
    几周前这场讨论还难以想象
  • 【光明论坛】把真抓实干当作衡量政绩标尺 7天前
    早盘:美股小幅下滑 ,此前标普500指数再创历史新高
  • 慧择保险管理层换届:蒋力功成身退,李欣接棒迎战行业下半场 5天前
    局势生变!全球接到消息,美军全部撤离,所有军事基地被叙国接管
  • 餐饮出海:大量品牌还在“新手村”,服务全球88%餐饮巨头的艺康给了这份攻略 1天前
    加密货币公司寻求接入Anthropic的Mythos模型,同时加固自身防御