奥特曼在内部信中提到,尽管OpenAI仍处于领先地位,但谷歌正在迅速缩小差距。他特别指出,谷歌的最新进展让他感到危机感。
谷歌的突破主要体现在其图像生成技术上,尤其是Nano Banana Pro模型。该模型采用了创新性的思维链推理机制,使生成的图像更加符合物理逻辑和真实场景。例如,在接到“画一个厨房”的指令时,模型会先进行空间关系和物体数量的推理,再生成图像。
OpenAI与谷歌在技术路线上的差异显著。OpenAI主要依赖概率猜测和直觉式生成,而谷歌则注重准确性和逻辑性,即所谓的“Grounding”。这种差异源于两者的训练数据和方法不同:谷歌利用了YouTube的海量视频数据,掌握了物理世界的运行规律;而OpenAI则侧重于文本模型的发展。
此外,产品理念的不同也影响了技术发展。OpenAI强调快速迭代和市场契合度,通过模块化拼接实现功能提升;而谷歌则更注重基础架构的优化,追求长期稳定的性能提升。
尽管如此,奥特曼意识到,谷歌的技术进步正对OpenAI构成挑战。他提醒团队要保持警惕,并加速技术升级以应对竞争。



