IBM CEO:DeepSeek 证明我们是正确的,小型且高效的模型同样能有实际
快讯 零壹财经 零壹财经 2025-02-07 阅读:1125
Arvind Krishina 的观点大意如下:
上周,DeepSeek 打破了 AI 领域的传统认知。一直以来,人们普遍认为,训练最先进的 AI 模型需要投入超过 10 亿美元,并依赖数千枚最新的芯片。AI 必须是专有技术,只有少数几家公司具备开发它的能力,因此保密至关重要。
但 DeepSeek 的做法颠覆了这一认知。新闻报道指出,他们仅用约 2000 枚英伟达芯片,以大约 600 万美元的成本训练了最新的模型,远低于行业预期。这再次证明,小型、高效的模型也能带来实际成果,无需依赖庞大而昂贵的专有系统。
然而,这一突破引出了一个更深层次的问题:AI 的未来究竟掌握在谁手中?AI 的发展不能由少数几家公司垄断,尤其是其中一些公司可能在数据保护、隐私和透明度等基本价值观上存在分歧。答案不是限制技术进步,而是要推动更广泛的合作,确保大学、企业、研究机构和社会组织共同参与 AI 的构建。
替代方案是,AI 的主导权可能会落入价值观和优先事项不同的参与者手中,这意味着未来社会和产业变革的关键技术将不再受掌控。真正的创新和进步,只有在 AI 的开发权得到广泛共享的前提下才能实现。
AI 行业已经走过了炒作期。2025 年,AI 必须从少数巨头的封闭体系中解放出来。到了 2026 年,社会各界不仅要使用 AI,更应投身于它的研发。
开源的小模型将成为实现这一目标的关键。DeepSeek 的成功说明,真正出色的工程技术应当在性能和成本之间找到最佳平衡。过去,行业普遍认为更大规模的模型才能带来更好表现,但真正的突破并不在于规模,而在于效率。我们在 IBM 的研究表明,针对特定应用优化的模型已经将 AI 推理成本降低了最多 30 倍,使训练更高效、更易获取。
我并不认为 AGI 即将实现,也不认同未来的 AI 需要依赖庞大的核能数据中心。这种论调人为制造了错误的选择题。AI 的高昂成本并非必然,它只是一个尚待解决的工程挑战。无论是成熟企业还是初创公司,都有能力推动成本下降,让 AI 更实用、更普及。(IT之家)
相关文章
用户评论
所有评论
主编精选
more专题推荐
more
第四届中国零售金融发展峰会(共15篇)
资讯排行
- 48h
- 7天
-
首页
-
评论
-
回顶部
游客
自律公约