DeepSeek V4七月中旬上线，峰谷定价与DSpark技术双轮驱动升级-企业动态-贝尔财经

DeepSeek近期在产品迭代与技术开源领域双线发力，正式版V4模型与推理加速框架DSpark的同步推进，标志着这家AI企业在商业化与技术突破间找到新的平衡点。7月中旬即将上线的V4正式版不仅在功能上进一步优化，更引入峰谷定价机制，而与北京大学联合研发的DSpark框架已实现线上全量部署，显著提升模型推理效率。

V4系列模型分为旗舰版V4-Pro与轻量版V4-Flash，前者参数量达1.6万亿，激活参数490亿，预训练数据量33万亿字节，支持百万字上下文处理；后者参数量2840亿，激活参数130亿，预训练数据32万亿字节，同样具备百万字上下文能力。两款模型均已开源并提供API服务，其中V4-Pro在网页端以专家模式运行，V4-Flash则采用快速模式，满足不同场景需求。

峰谷定价机制成为此次更新的核心变量。根据新规，API使用成本将按时段划分：每日9时至12时、14时至18时为高峰时段，收费翻倍；其余时段维持现行价格。这一策略旨在通过价格杠杆引导用户错峰使用，优化资源分配。对于必须在工作时段密集调用API的企业用户，成本将直接上升；而具备任务调度能力的用户则可通过迁移至低峰时段维持原有支出水平。

技术层面，DSpark框架的落地为模型推理效率带来质的飞跃。实测数据显示，部署DSpark后，V4-Flash单用户生成速度提升60%至85%，V4-Pro提升57%至78%。这一成果源于框架对推测性解码技术的工程化优化——通过轻量级小模型快速生成候选token，再由大模型并行验证，在保证生成质量的前提下大幅提升速度。该框架已作为全栈推测性解码工具链DeepSpec开源，论文由创始人梁文锋署名并上传至公开代码库。

DSpark的创新集中在两大技术瓶颈的突破。针对并行生成中“后缀衰减”问题，框架采用“并行主干+轻量串行头”的两阶段设计：并行部分保留速度优势，串行模块补充相邻token间的依赖关系，修正语义冲突。测试表明，2层深度的DSpark有效接受长度甚至超过5层深度的纯并行方案。另一创新是置信度调度验证机制，通过在草稿模型中嵌入置信度评分模块，实时预测候选token的接受概率，并将评分误差压缩至1%以内。调度器据此动态调整验证长度，低并发时拉满算力，高并发时裁剪低价值token，避免资源争抢。

对于API用户而言，峰谷定价将直接推高工作时段的使用成本，但推理速度的提升或可在高并发场景下部分抵消这一压力。开发者则受益于DSpark的开源特性，其工程化落地方案降低了推理优化的技术门槛，为行业提供了可复用的技术路径。这一系列动作显示，DeepSeek正通过技术突破与商业策略的协同，在激烈的市场竞争中构建差异化优势。