MyShare - 首页 - 微博


昨天我看到人工智能专家wgwang说起的一件事——2020年,ChatGPT的前身GPT3刚出来的时候,上海经信委第一时间就对GPT3进行了调研……

当时专家和经信委的领导都感到了棘手,wgwang的原话是——“GPT3很费钱,国内初创企业搞不定的,国内大企业也大概率会因为没有短期直接的收益而投入不多”

“使用微软提供的AI超级计算机,训练一次GPT3的时间大约是5天左右;如果使用美国云服务提供商提供的GPU来训练,训练一次GTP3需要耗费从280万到540万美元不等,其价格主要取决于使用哪种gpu/tpu硬件。”

好家伙,训练一次的成本就高达3000多万人民币,国内哪家国企&私企也烧不起这种虚无缥缈的钱啊……本质上还是不够富,试错机会太少,毕竟即便举国立项也拼不过华尔街开动全球印钞机和路演机啊。

而这些成本还只是GPT3总成本里的冰山一角,因为海量“高质量”数据的成本更高,因为这涉及到语言文化的基本盘——我们华人的人工智能数据总不能拿英语世界的数据来训练啊,否则练出来的就是四不像,根本不实用。

而中文和英文数据的质量比拼,那就牵扯到了无数基础领域的积累,那钱的投入可就海了去,这就是科学领域的滚雪球马太效应,西方世界有了好几百年的先手积累,马太效应压着其他国家打,后起国家非常非常费力。

从本质上讲,chatGPT又是一次典型的欧美马太效应成果,其他国家想要跟进,那就不得不再次捏着鼻子使用英文数据进行训练,以时间换空间,搞胡服骑射。

这就是宇宙沙盒游戏竞争的残酷,要么被同化(日韩被美国同化),要么就继续不服输的竞争(人终究还是需要争一口气的)。

竞争不是坏事,也不是资源浪费,这是地球生态系统的多样性备份的必然,否则假若全部同质化,万一遇到天灾,人类很容易瞬间团灭。

请大家参阅。

https://weibo.com/mygroups?gid=4022993045195412