2025年第4周 AI全球热门资讯TOP10

一、四家 AI 公司同日发布新品,大模型赛道竞争再升级

春节前夕,中国 AI 领域迎来了一场激烈的新品发布热潮。仅在 1 月 20 日这一天,四家颇具影响力的公司便同步推出新品,为大模型市场的竞争格局带来了全新的变化,也让全球 AI 行业的目光聚焦于此。深度求索公司 DeepSeek 发布了 DeepSeek-R1 模型,月之暗面公司 Kimi 推出了 k1.5 多模态思考模型,两款模型均将目标锁定为对标 OpenAI 的 o1 正式版,展现出强劲的竞争实力。与此同时,MiniMax 海螺上线语音功能,字节跳动旗下的豆包也推出实时语音大模型,显然是在对标 OpenAI 的实时语音应用,力求在语音交互领域占据一席之地。

自 2022 年 11 月 OpenAI 发布 GPT-3.0 以来,全球科技行业迅速掀起了大模型研发的热潮。OpenAI 秉持 “大力出奇迹” 的理念,将模型规模视作核心竞争力,不断追求极致性能,致使模型体积不断膨胀,参数数量呈指数级增长。这种近乎疯狂的 “军备竞赛” 式开发,带来了惊人的能源消耗与高昂的训练成本。据估算,OpenAI 在 2024 年的亏损可能高达 50 亿美元,业内专家更是预测,到 2026 年这一亏损数额将攀升至 140 亿美元。

与 OpenAI 的发展路径不同,中国公司另辟蹊径,运用剪枝、量化、知识蒸馏等创新技术,开启了大模型 “瘦身” 潮流,致力于打造 “小而强” 的模型。以 DeepSeek 为例,其研发的 R1 模型在多个权威基准测试中,性能表现与 OpenAI 的 o1 不相上下,然而成本却仅为 o1 的三十分之一。从时间维度来看,OpenAI 在 2024 年 12 月推出正式版 o1 模型,仅仅一个多月后,DeepSeek 就成功发布了性能相当的 R1 模型,追赶速度之快令人惊叹。

DeepSeek 的成功实践表明,大模型创新并非只能依赖最先进的硬件设施,通过精巧的工程设计和高效的训练方法,同样能够达成优异的成果。这一技术突破意义深远,不仅大幅降低了 AI 大模型对硬件的要求,减少了能源消耗,更为重要的是,为 AI 技术的广泛普及奠定了坚实基础。更小的模型意味着更低的部署成本、更快的响应速度,以及更广泛的应用场景。在医疗领域,轻量级 AI 模型能够快速分析患者的医疗影像,辅助医生进行精准诊断;在教育领域,它可以根据学生的学习情况,提供个性化的学习方案;在制造领域,能够实现生产流程的智能优化,提高生产效率。这一系列变革标志着 AI 大模型正经历着如同手机从 “大哥大” 向智能终端转变的进化历程,“小而强” 的 AI 模型将推动人工智能从实验室走进千家万户,从云端迈向边缘端。当然,大模型 “瘦身” 之路并非一帆风顺,仍面临诸多挑战。如何在保证模型性能的前提下,实现最大限度的 “瘦身”,以及确保 “瘦身” 后的模型在不同应用场景下的适应性和稳定性,都是亟待解决的问题。在商业竞争的大舞台上,高效、灵活、低成本的解决方案无疑更具竞争力。中国公司在 AI 大模型领域,正逐步从模仿者向创新者和引领者转变,未来大模型 “瘦身” 有望迎来更广阔的发展空间。

二、DeepSeek 发布 R1 模型,震撼全球 AI 科技圈

1 月 20 日,AI 初创公司 DeepSeek 正式发布其最新推理模型 DeepSeek-R1,并同步开源模型权重。这一举措犹如一颗重磅炸弹,在全球 AI 科技圈引发了轩然大波。多家英美主流媒体,如《纽约时报》《经济学人》《华尔街日报》等,纷纷对 DeepSeek 的研究进展进行报道,高度赞扬其模型的强大性能。CNBC 甚至发文称 “DeepSeek-R1 因其性能超越美国顶尖同类模型,且成本更低,算力消耗更少,引发了硅谷的恐慌” 。

DeepSeek-R1 在模型后训练阶段大规模应用强化学习技术,即便仅使用极少的标注数据,也能显著提升推理能力。在多个基准测试中,DeepSeek-R1 表现出色。例如在 AIME 2024 数学竞赛中取得了 79.8% 的成绩,略高于 OpenAI 的 o1-1217 版本;在 MATH-500 测试中,DeepSeek-R1 达到了 97.3% 的高分,与 o1-1217 相当,同时显著优于其他模型 。

该模型的发布不仅在技术层面展现出强大实力,还在行业格局上产生了深远影响。英伟达的竞争对手、知名半导体公司超微半导体 (AMD) 发布消息称,已将 DeepSeek-V3 模型集成到 AMD 的芯片产品 Instinct MI300X GPU 上,旨在与 SGLang 一起实现最佳性能。这一合作有望打破 “英伟达 + OpenAI” 联合主导的行业格局,为 AI 芯片与模型的发展带来新的格局。同时,DeepSeek-R1 的开源以及其 “小成本办大事” 的特性,通过采用创新架构和优化算法实现具有更高经济性的训练效果和更高效的推理,让硅谷巨头们感受到了前所未有的压力。有 Meta 员工爆料称 Meta 的生成式人工智能团队正陷入恐慌,工程师们疯狂拆解 DeepSeek 试图复制其成果,而 Meta 管理层也面临着如何向公司高层解释投入产出比的难题 。

从市场角度来看,DeepSeek-R1 的崛起也引发了资本市场的关注。有观点认为,其成功预示着 AI 大模型对算力投入的需求将大幅下降,这无疑将利空全球 AI 算力的核心供应商英伟达,因为过去模型训练是英伟达 GPU 的优势所在,而如今随着模型基本训练成型及 AI 应用的爆发,算力的增长或将更侧重于推理侧,DeepSeek 降低了模型训练成本,可能会削弱市场对英伟达 AI 芯片需求的预期。但也有观点指出,训练成本的降低未必意味着算力需求下降,只代表模型厂商可以使用性价比更高的方式去做模型极限能力的探索,DeepSeek-V3 意味着 AI 大模型的应用将逐步走向普惠,助力 AI 应用广泛落地,同时训练效率大幅提升亦将助力推理算力需求高增。

三、微软向部分 Copilot 用户免费开放 “深度思考” 功能,助力智能办公升级

微软近期开始向部分 Copilot 用户免费开放 “深度思考” 功能,该功能基于 OpenAI 的 o1 模型,旨在提升用户在数学、科学、编码等领域的处理能力。这一举措是微软在 AI 应用领域的又一次重要尝试,通过将先进的 AI 模型与自身的办公软件生态相结合,为用户提供更加智能、高效的工作和学习体验。

在数学领域,“深度思考” 功能可以帮助学生和科研人员快速解决复杂的数学问题,提供详细的解题步骤和思路;在科学研究中,能够辅助分析实验数据、推导科学理论;对于程序员来说,它可以协助代码编写、查找代码中的错误以及提供优化建议。微软的这一做法,不仅提升了 Copilot 的竞争力,也进一步推动了 AI 在办公和学习场景中的应用普及。通过免费开放这一功能,微软有望吸引更多用户使用 Copilot,巩固其在办公软件市场的地位,同时也为其他企业在 AI 与办公软件融合方面提供了借鉴。

四、Deezer 推出 AI 音乐检测工具,为音乐行业规范保驾护航

Deezer 推出了一款 AI 音乐检测工具,该工具每天可识别超过 1 万首 AI 创作音乐,并且计划扩展检测更多类型。随着 AI 技术在音乐创作领域的应用越来越广泛,AI 创作音乐的版权、质量等问题也逐渐受到关注。Deezer 的这款检测工具,能够帮助音乐平台和创作者更好地识别 AI 创作音乐,对于维护音乐行业的版权秩序、提升音乐作品质量具有重要意义。

一方面,它可以帮助版权方确认音乐的创作来源,避免版权纠纷;另一方面,通过对 AI 创作音乐的检测和分析,也可以促进 AI 音乐创作技术的发展和完善。同时,这一工具的推出也反映了音乐行业对于 AI 技术的积极应对和规范管理的态度,未来随着技术的不断进步,AI 音乐检测工具可能会在音乐行业中发挥更加重要的作用,推动音乐行业在 AI 时代的健康发展。

五、字节跳动携手北大推出 PaSa,革新学术论文检索体验

字节跳动与北京大学共同推出了 PaSa,这是一款基于大语言模型的智能学术论文搜索代理,旨在提升文献检索效率。在学术研究领域,快速准确地检索到相关文献是科研人员开展工作的基础,但随着学术文献数量的不断增长,传统的检索方式往往难以满足科研人员的需求。

PaSa 利用大语言模型的强大理解和分析能力,能够更好地理解用户的检索意图,提供更加精准的文献检索结果。它可以对用户输入的问题进行深入分析,然后在海量的学术文献中进行筛选和匹配,大大提高了文献检索的效率和准确性。这一成果不仅体现了字节跳动在 AI 技术应用方面的实力,也为学术研究领域提供了有力的工具支持,有助于推动学术研究的发展和创新。通过与高校的合作,字节跳动也进一步拓展了 AI 技术的应用场景,实现了产学研的深度融合。

六、商汤科技显演包 APP 上线,拓展 AI 消费级应用边界

商汤科技推出的 Vimi 相机正式更名为显演包 APP,这款 APP 具备 AI 角色扮演、变声器和视频动态效果等功能,为用户提供了更加丰富的 AI 应用体验。在当下的移动互联网时代,用户对于拍照和视频编辑的需求越来越多样化,显演包 APP 的这些功能正好满足了用户对于个性化、趣味性的追求。

AI 角色扮演功能可以让用户轻松扮演各种角色,通过 AI 技术实现形象和声音的转换;变声器功能为用户的视频和语音交流增添了更多乐趣;视频动态效果则可以让用户的视频更加生动、富有创意。商汤科技通过不断优化和拓展 APP 的功能,将 AI 技术与用户的日常生活紧密结合,提升了用户对于 AI 技术的感知和应用,也为 AI 在消费级应用领域的发展提供了新的思路和方向。

七、微软联合高校推出 AIOpsLab,推动云服务运维智能化变革

微软与高校合作推出了开源工具 AIOpsLab,该工具通过协调器等五大模块,旨在提升云服务的自动化运维效率。随着云计算技术的广泛应用,云服务的运维管理变得越来越复杂,传统的运维方式难以满足高效、稳定的要求。

AIOpsLab 利用 AI 技术,实现了对云服务运维的智能化管理。它可以实时监测云服务的运行状态,及时发现潜在的问题并进行预警,同时还能自动进行故障诊断和修复,大大提高了云服务的可靠性和稳定性。通过开源这一工具,微软不仅促进了 AI 技术在云服务运维领域的应用和发展,也加强了与高校之间的合作与交流,为培养相关领域的专业人才提供了实践平台,推动了产学研的协同创新。

八、AMD 集成 DeepSeek-V3,开启 AI 推理新征程

AMD 宣布将 DeepSeek-V3 模型集成到其芯片产品 Instinct MI300X GPU 上,通过多头潜在注意力和负载平衡策略来优化 AI 推理。这一合作对于 AI 推理领域具有重要意义,一方面,DeepSeek-V3 模型针对 AI 推理进行了优化,其与 AMD 的芯片相结合,有望提升芯片在 AI 推理任务中的性能表现;另一方面,AMD 作为全球领先的芯片厂商,通过与 DeepSeek 合作,为 AI 推理带来了新的想象空间。

这种合作模式打破了以往 AI 领域中 “英伟达 + OpenAI” 联合主导的行业格局,为其他企业和研究机构提供了新的合作思路和发展方向。同时,也促使整个 AI 芯片和模型领域的竞争更加激烈,推动技术不断创新和进步,未来可能会有更多类似的合作出现,进一步推动 AI 技术在各个领域的应用和发展。

九、中国电信发布 TeleAI-t1-preview,展现通信行业 AI 实力

中国电信人工智能研究院发布了 “复杂推理大模型” TeleAI-t1-preview,该模型通过强化学习提高了逻辑推理和数学推导的准确性。在人工智能的应用中,复杂推理能力是衡量模型性能的重要指标之一。

TeleAI-t1-preview 在逻辑推理方面,可以帮助用户解决复杂的问题,如法律咨询、智能客服中的复杂问题解答等;在数学推导方面,能够辅助科研人员进行数学建模、数据分析等工作。中国电信发布这一模型,展示了其在 AI 领域的技术实力和创新能力,也为通信行业以及其他相关领域的智能化发展提供了技术支持,未来随着模型的不断优化和完善,有望在更多领域发挥重要作用。

十、Anthropic 推出 Citations API,为 AI 内容可信度添砖加瓦

Anthropic 推出了 Citations API,这一功能旨在提升 AI 内容的可信度,支持溯源验证。在 AI 生成内容日益普及的今天,内容的真实性和可信度成为了人们关注的焦点。Citations API 允许用户查看 AI 生成内容所依据的来源和参考资料,使得 AI 生成的文本更加透明、可追溯。

这一功能的推出,对于新闻、学术、金融等对内容准确性要求较高的领域具有重要意义。在新闻报道中,可以避免虚假信息的传播;在学术研究中,能够确保研究成果的可靠性;在金融领域,可以为投资决策提供更加准确的信息支持。Anthropic 的这一举措,推动了 AI 技术在内容生成方面向更加规范、可信的方向发展,也为其他 AI 企业在提升内容质量和可信度方面提供了借鉴。

发表回复