DeepSeek

3K 00

DeepSeek 是 2023 年成立于中国杭州的人工智能公司,专注于大语言模型与多模态技术的底层创新,其开发的模型具有低成本高效训练、多模态推理能力强、长文本处理出色等特点,在自然语言处理和多模态交互领域具有显著影响力

所在地:
中国
收录时间:
2025-10-13
DeepSeekDeepSeek

DeepSeek 是 2023 年成立于中国杭州的人工智能公司,专注于大语言模型与多模态技术的底层创新,其开发的模型具有低成本高效训练、多模态推理能力强、长文本处理出色等特点,在自然语言处理和多模态交互领域具有显著影响力。

DeepSeek 的出身于量化投资巨头幻方量化,DeepSeek以混合专家架构(MoE)实现技术突围——6710亿参数规模下,单次推理仅激活370亿参数,成本仅为GPT-4 Turbo的1%。其独创的多头潜在注意力机制,可精准处理128K超长上下文,相当于记住整部小说的对话细节。在医疗、金融等领域已服务200余家机构,日活用户超3000万,更以动态计算技术将训练成本压缩至600万美元,打破大模型烧钱魔咒。从代码生成到气候预测,持续进化的DeepSeek正在重塑AI产业边界。技术实力在全球处于领先水平,是中国 AI 领域的重要力量。

根据知名分析机构 Artificial Analysis 的报告,DeepSeek 凭借 DeepSeek-R1-0528 模型,在综合能力评分中斩获 68 分,与谷歌 Gemini 2.5 Pro 并列全球第二,仅以 2 分之差紧随 OpenAI 的 o4-mini 之后。在关键能力上,其数学推理准确率从 70% 跃升至 87.5%,代码生成能力逼近 Claude 4 Opus,位居开源模型第一,幻觉率降低 50%,文本处理更加可靠。
此外,在 2025 年 a16z 发布的全球生成式 AI 应用排行榜中,DeepSeek 在网页应用类别高居第二位,仅次于 ChatGPT。其新网站访问量也表现出色,2025 年 2 月,分析平台 aitools.xyz 数据显示,DeepSeek 的新网站访问量达 5.247 亿次,超越了 ChatGPT 同期的 5 亿次,在聊天机器人市场占据了 12.12% 的市场份额,全球排名第二。
DeepSeek 能取得这样的成绩,得益于其一系列的技术创新,如采用混合专家(MoE)架构、多头潜在注意力(MLA)机制以及 FP8 混合精度训练等技术,这些技术使其在模型效率、推理速度、成本控制等方面都具有显著优势。同时,DeepSeek 的开源策略也吸引了全球开发者的参与,进一步推动了其技术的发展和应用。

相关导航

暂无评论

none
暂无评论...