想法很有意思,核心思想是递归地调用生成模型作为模块,构建具有自相似性的生成模型。
就是将一个图形不断地进行放大,会发现放大后的图形与原始图形在结构上非常相似。简单地类比,就像雪花一样,是一种典型的分形(Fractal)结构。
作者想法的核心来源是:
而进一步选用了自回归模型(AR Model)作为分形生成器的具体实现。也就是说用AR模型作为「原子模块」,像俄罗斯套娃一样层层嵌套——高层模型规划图像整体布局,中层细化局部结构,底层最终确定每个像素的细节。
通过这种「分而治之」的策略,模型的计算复杂度大大下降,而且能生成媲美扩散模型的生成质量。
总体来说是个很新颖的点子,大佬的思路就是开阔。激发了我学习更多脑神经科学的兴趣。期待后续的研究提供理论、实验的支撑。