近日,Meta宣布其正在研发的下一代芯片将具备更加强大的处理能力,能够更迅速地训练其人工智能模型。这款名为Meta训练与推理加速器(MTIA)的芯片,特别针对Meta的排名和推荐模型进行了优化,能够使训练过程变得更加高效,并且简化了推理任务——也就是实际的计算过程。
Meta在2023年5月首次宣布了MTIA v1,这款芯片主要面向数据中心。预计下一代的MTIA芯片也将主要服务于数据中心。虽然原计划是在2025年推出MTIA v1,但Meta现在表示,两款MTIA芯片已经开始生产。目前,MTIA主要用于训练排名和推荐算法,但Meta的目标是最终扩展芯片的功能,开始训练生成式人工智能,比如其Llama语言模型。
新一代的MTIA芯片“基本上着重于提供计算、内存带宽和内存容量之间的正确平衡。”这款芯片将配备256MB的芯片上内存和1.3GHz的频率,相较于v1版本的128MB和800MHz有所提升。Meta的早期测试结果显示,新芯片在评估的四种模型中的性能比第一代版本提高了三倍。
Meta一直在开发MTIA v2,该项目内部被称为“Artemis”,之前的报道指出它主要关注于推理。随着对计算力需求的增加和人工智能的广泛应用,其他人工智能公司也在探索制造自己的芯片。
Google在2017年推出了其新的TPU芯片,而Microsoft宣布了其Maia 100芯片。亚马逊同样推出了其Trainium 2芯片,该芯片训练基础模型的速度是前一版本的四倍。这些进展表明,科技巨头们正致力于通过自主研发的芯片来提升其人工智能模型的性能和效率,以应对日益增长的数据处理需求。
原创文章,作者:scorpio,如若转载,请注明出处:http://bxgjw.com/zixun/4480/.html