MyShare - 首页

昨天我看到人工智能专家wgwang说起的一件事——2020年，ChatGPT的前身GPT3刚出来的时候，上海经信委第一时间就对GPT3进行了调研……

当时专家和经信委的领导都感到了棘手，wgwang的原话是——“GPT3很费钱，国内初创企业搞不定的，国内大企业也大概率会因为没有短期直接的收益而投入不多”

“使用微软提供的AI超级计算机，训练一次GPT3的时间大约是5天左右；如果使用美国云服务提供商提供的GPU来训练，训练一次GTP3需要耗费从280万到540万美元不等，其价格主要取决于使用哪种gpu/tpu硬件。”

好家伙，训练一次的成本就高达3000多万人民币，国内哪家国企&私企也烧不起这种虚无缥缈的钱啊……本质上还是不够富，试错机会太少，毕竟即便举国立项也拼不过华尔街开动全球印钞机和路演机啊。

而这些成本还只是GPT3总成本里的冰山一角，因为海量“高质量”数据的成本更高，因为这涉及到语言文化的基本盘——我们华人的人工智能数据总不能拿英语世界的数据来训练啊，否则练出来的就是四不像，根本不实用。

而中文和英文数据的质量比拼，那就牵扯到了无数基础领域的积累，那钱的投入可就海了去，这就是科学领域的滚雪球马太效应，西方世界有了好几百年的先手积累，马太效应压着其他国家打，后起国家非常非常费力。

从本质上讲，chatGPT又是一次典型的欧美马太效应成果，其他国家想要跟进，那就不得不再次捏着鼻子使用英文数据进行训练，以时间换空间，搞胡服骑射。

这就是宇宙沙盒游戏竞争的残酷，要么被同化（日韩被美国同化），要么就继续不服输的竞争（人终究还是需要争一口气的）。

竞争不是坏事，也不是资源浪费，这是地球生态系统的多样性备份的必然，否则假若全部同质化，万一遇到天灾，人类很容易瞬间团灭。

请大家参阅。

MyShare - 首页 - 微博