蚂蚁集团CTO何征宇:坚决投入大模型底层基础设施,已建成万卡AI集群
来源:IT之家 发布时间:2023-09-09 12:15 作者:IT之家 阅读量:7505
9 月 8 日下午消息,在 2023 外滩大会上,蚂蚁集团宣布发布金融大模型,并开源生成式 AI 编程平台 CodeFuse。
蚂蚁集团首席技术官、平台技术事业群总裁何征宇在接受采访时介绍,蚂蚁大模型走纯自研的技术路线,以全栈布局、长线发展为原则,以创造产业价值为目标。为此,蚂蚁坚决投入大模型底层基础设施,目前已建成万卡 AI 集群,训练效率领先行业,为大模型产业化应用提供有力支撑。
何征宇介绍,蚂蚁一直以来坚持核心技术自主创新,2022 年底正式立项大模型研发,目前已形成从基础大模型到行业大模型以及产业应用的全栈布局。
今天发布的蚂蚁金融大模型基于蚂蚁基础大模型,针对金融产业深度定制。何征宇介绍,蚂蚁基础大模型平台具备万卡异构集群,其中千卡规模训练 MFU 可达到 40%,集群有效训练时长占比 90% 以上,RLHF 训练在同等模型效果下训练吞吐性能相较于业界方案提升 3.59 倍,推理性能相较于业界方案提升约 2 倍,处于业界先进水平。
何征宇表示,未来蚂蚁将持续探索和精进大模型的五大能力方向。一是,建设高质量的数据标注团队,沉淀高质量数据体系;二是,攻坚基础大模型算法,以及高效绿色工程能力,提升模型逻辑推理等能力;三是,从通用语言大模型到通用多模态大模型,从一般通识走向全面专业;四是,建设高效的大模型评测标准和评测体系,加快大模型迭代速度;五是,建设大模型安全能力,保障大模型健康可持续发展。
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
站点精选
- 安然纳米发光体—胡感:我们也许改变不了这个世
- 神舟十四号航天员乘组进行首次出舱活动,预计约
- 2022服贸会开幕 京东企业业务分享大中小
- 农业农村部:抓好农业防灾减灾突出实效用足用好
- 博闻科技上半年净利增长77.17%水泥粉磨站
- 特斯拉在北京建成100座超级充电站,车主平均
- 苹果AppleWatchSeries8将有新
- 和讯曝财报丨泛海控股2022上半年总营收39
- 华为PC应用引擎开启尝鲜招募:号称“电脑上的
- 柯利达:2022年半年度净利润约-2906万
- 东宝生物:“胶原+”战略实现突破营收净利双双
- 威尔士健身房刚办卡就关店?上海阿姨无语:故意
- 天风证券给予立讯精密买入评级
- 圣农发展获开源证券买入维持评级:近期获8份券
- PVC改性剂行业迎重要机遇期日科化学上半年净
- 梅赛德斯奔驰C350eL插电车上市:21分钟