ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

马斯克警示:AI训练已逼近数据极限,合成数据成未来关键?

时间:2025-01-14 14:00:55来源:北信源编辑:快讯团队

近期,科技界巨头埃隆·马斯克在CES展会的一次访谈中,提出了一个引人深思的观点:他认为,用于训练人工智能(AI)模型的现实世界数据资源已接近枯竭。马斯克指出,到2024年,人类累积的知识几乎已被AI训练完全消耗。

这一看法与OpenAI的前首席科学家伊利亚·苏茨克维在去年12月的“NeurIPS”机器学习会议上所表达的观点不谋而合。苏茨克维同样认为,AI产业可获取的数据量已经达到了极限。

面对这一挑战,马斯克提出了一个创新的解决方案:利用合成数据作为未来AI发展的方向。他强调,合成数据是由AI自行生成并用于训练的,这是补充现实世界数据的唯一可行方法。通过这种方法,AI系统可以为自己生成训练数据,进行自我评估和学习。

事实上,这一趋势已经在科技巨头中悄然兴起。微软、meta、OpenAI以及Anthropic等企业已经开始在AI模型训练中广泛应用合成数据。科技市场研究机构Gartner预测,2024年,AI及分析项目中使用的数据中,有高达60%是合成数据。

例如,微软在近期开源的AI模型“Phi-4”就是结合了合成数据和现实世界数据进行训练的。同样,谷歌的“Gemma”模型也采用了类似的策略。Anthropic利用部分合成数据开发了表现出色的“Claude 3.5 Sonnet”系统,而meta则通过AI生成的数据来微调其最新的Llama系列模型。

更多热门内容