***** - 首页 - 微博


说白了,AI现在最主要的三块,算力,数据,算法,百度能控制的其实只有算法,而且事实上,算法和模型反而是国内公司差距最小的,反正一大堆开源的,最不济拿来用用就行啊。算力不用说了,美帝卡脖子卡的死死的,A100都不卖给你了,只能买阉割的A800,还几乎买不到,然后NV马上要出H100,这块差距会越来越大,很难弥补。可能的方向是想办法用超算来弥补,把训练跑到超算上,但这个需要的基础工作很多,各种算子和框架的适配和重新实现,这事也不是百度自己能搞的。至于数据,这事更怪不到百度了,国内进入移动互联网之后就事实上割裂了,各种APP都不开放数据让别人抓,数据都只是握在自己手里,标注好的高质量数据非常少。一开始还无所谓,大家都用自家数据也能玩,大模型一出,需要的数据量剧增,国内就傻逼了。用国外的数据训练,又想支持好中文,那可不得想想办法走翻译吗,那出一些笑话不是很正常。不过现在国家成立数据局了,可以来协调数据开放使用的事情,而且数据这事,没啥技术门槛,只要充钱都能搞定,openai在标注数据上也一样花了大价钱的。所以最终,卡脖子还是卡在算力,也就是芯片上,这事我也不知道有啥办法,走一步算一步吧。

https://weibo.com/mygroups?gid=221012100009820647