语言训练-的相关资讯
[百度CEO李彦宏发布预训练生成式大语言模型“文心一言”,包含五大落地场景]
[3月16日,百度CEO李彦宏正式发布预训练生成式大语言模型“文心一言”。“文心一言”目前包含以下五类落地场景:文学创作、商业文案创作、数理逻辑推送、中文理解、多模态生成。 ]
[科大讯飞:已面向认知智能领域陆续开源了超过40个中文预训练语言模型]
[2月8日讯,科大讯飞在互动平台表示,科大讯飞在预训练模型方面,有坚实的相关技术积累,且已面向认知智能领域陆续开源了6大类、超过40个通用领域的系列中文预训练语言模型,成为业界最广泛流行的中文预训练]
[上海AI实验室发布大模型训练工具箱XTuner,降低大模型训练门槛]
[9月20日讯,上海人工智能实验室(上海AI实验室)发布了一款面向大模型训练的开源工具箱XTuner,再次降低了大模型训练门槛。据悉,XTuner聚焦于微调环节,为各类开源大模型提供了轻量级微调框架,]
[百奥几何与智谱AI共建自然语言-生命语言多模态大模型]
[12月18日,北京百奥几何生物科技有限公司和北京智谱华章科技有限公司近日宣布达成战略合作,共同致力于建设自然语言-生命语言多模态大模型。该模型预期将增进生成式人工智能平台在生命科学与医药研究领域的]
[马斯克:特斯拉今年将在AI训练和推理方面投入约100亿美元]
[4月28日,马斯克在社交平台表示,特斯拉今年将在AI训练和推理方面投入约100亿美元,后者主要用于汽车。任何公司如果不能达到这一水平的支出,且不能高效地进行支出,就无法参与竞争。]
[阿里云宣布支持Llama 3训练推理,并提供免费算力]
[4月22日讯,Meta开源最新Llama 3系列,阿里云魔搭社区第一时间上架全部4款模型。阿里云百炼大模型服务平台宣布在国内首家推出针对Llama 3系列的限时免费训练、部署、推理服务,企业和开发者]
[百度智能云宣布国内首家支持Llama3全系列训练推理]
[4月19日讯,百度智能云千帆大模型平台推出针对Llama3全系列版本的训练推理方案,便于开发者进行再训练,搭建专属大模型,现已开放邀约测试。目前,百度智能云千帆大模型平台中各种尺寸模型定制工具]
[GTC大会发布快手大模型训练解决方案]
[3月21日,英伟达GTC大会上公布了快手的大模型训练解决方案,沿着大模型训练热点演进过程,分享了在计算通信重叠系列优化和超长文本场景下的实践,通过计算通信重叠、异构存储利用、通信资源管控、算子优化等]
[世界第一AI芯片WSE-3面世,一天就可以完成Llama 700亿参数的训练]
[3月14日讯,美国加州半导体公司Cerebras Systems发布第三代晶圆级AI加速芯片“WSE-3”(Wafer Scale Engine 3),规格参数更加疯狂,而且在功耗、价格不变的前提下性能翻了一番。]