大模型能力的涌现,离不开互联网时代的海量数据养料积累。据沈向洋分享,如今数据存量告急,对使用合成数据来训练未来模型的需求越来越迫切了。在这个方向上,IDEA团队研发了IDEA Data Maker,通过自研语境图谱技术,解决过往文本数据合成方案的多样性匮乏等问题,还能为合成数据引入“指导手册”,以图谱为纲,指导用于合成的语境采样。实验结果显示,IDEA团队的方案能持续为大模型带来能力提升,表现超过目前的最佳实践(SOTA);从token消耗来看,平均节约成本85.7%。目前,该技术内测平台已开放,通过API提供服务。在拓展新前沿的同时,大模型价值创造也在进行时。大会上,IDEA发布了多个垂类行业应用落地进展,包括:学术大模型和AI科研神器ReadPaper、营销创作大模型,以及面向经济与金融领域的经济大模型、运筹决策大模型、投资大模型。
▲经济大模型
▲运筹决策大模型
04.已研发多款化学专家大模型,AI编程工具链12月份开放
在基础研究愈发受到重视的当下,AI for Science是技术创新创业的重要方向。今年的诺贝尔物理学奖和化学奖,更是将这场科学革命推向聚光灯下。好的AI工具,可以帮助科学家做出更快、更好的科学发现。IDEA团队选择了化学领域,从预测能力和数据能力入手,进行了研究和产业化实践。在预测方面,IDEA研发的多个化学领域专家大模型,分子属性预测和化学反应预测能力均处业界领先水平;在数据方面,IDEA开发了化学文献多模态大模型,联合晶泰科技发布专利数据挖掘平台PatSight,将药物领域的专利化合物数据挖掘时间,从数周缩短至1小时。除了科学研究之外,另一个技术范式正在被AI重塑的领域,是编程语言。“全世界有那么多的编程语言,小语言、大语言、中语言,基本上没有一个语言真正被大家所用的是中国人发明、中国人创造,这种现象我们是有机会可以改变的。”沈向洋说。此次大会上,IDEA研究院的MoonBit团队就展示了其AI for coding的最新成果。MoonBit是专为云计算与边缘计算设计的AI云原生编程语言及工具链,已具备完备的多后端支持和跨平台能力,可在硬件上直接运行,支持RISC-V。MoonBit的开源开发平台,将于12月正式开放。据了解,MoonBit去年底刚开源只有几百位用户,今年3月用户数量达到三千,不到半年翻了十倍的增长,如今已有将近3万用户。预计2025年底,MoonBit将会有10万用户,并争取2026年底达到百万级的用户,成为粤港澳大湾区现象级的编程语言。 05.结语:AI发展,从推动经济增长到增加人类福祉
过去十几年来,人工智能的发展速度令人惊讶,人类许多自豪的能力都逐渐被AI接近甚至是超越。更令人惊讶的是,如今人工智能的能力已经不再是纯粹的单点能力的增加,而是通用人工智能整体能力的提升,对社会带来带来的影响也变得更为深远。沈向洋认为,从长远的人类社会发展角度来看,巨大跃迁都是由技术创新带来的。工业时代的全球GDP年均增速约为1%-2%,信息时代在3%-4%,而在人工智能时代,这个数字会是多少?在他看来,未来人工智能、机器人的数量会急剧增加,带来生产效率的巨大提升,GDP也可能会带来百分之十几的增长。但是,AI的发展,能不能从推动经济增长到转化为人类的最大福祉?这是在探索AI的道路上,必须要思考的问题。(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)科普视频2024年,AI步入推理时代,能耗成为算力性能破局的关键因素。联想集团发布《Game of AI》系列科普视频第二集《数据中心:如何与世界交换算力》,揭开了数据中心百年历史中明暗交织的角逐画卷。联想集团不断引领液冷技术向前,持续推动数据中心架构的革新,促进算力在各行各业的持续发展,助力加速进入人本智能的新时代。