***** - 首页 - 微博


当模型尺寸达到一定规模时,会出现突现能力,让性能急剧增加。我一贯的观点是,模型越大,数据越多,会使得模型内部的数据越稠密,在数学空间中,其平滑性更好,不会出现概念空洞,所以能够更好地进行推理和语言生成。

思维链是一个关键性的技术,毕竟人脑思考也是暗中独白。如果模型能够自发形成思维链,就通过图灵测试了。所以下一步应该将当前的语言生成分解为两步:

第一步,模型自发生成思维链,暗中独白
第二步,重新组织语言,最终输出

https://weibo.com/mygroups?gid=221012100009820647