加利福尼亚州旧金山,美国,2025年7月22日 – Glamai是影响者经济和时尚行业中AI驱动视觉营销的领先平台,很自豪地宣布,团队成员Alexander Lobashev是一份开创性研究论文的合着者。 ICML 2025 (机器学习国际会议),世界上最负盛名的AI会议之一。
该论文的标题为“生成模型中潜在空间的Hessian几何形状”,解释了AI图像编辑中的常见挫败感:为什么尝试平滑,逐渐变化会导致图像突然,不可预测地“跳跃”到完全不同的状态。研究表明,这不是随机的故障,而是这些模型如何工作的基本属性。这项研究是由一群杰出的AI科学家与领先的行业实验室和学术机构共同撰写的,对为什么生成模型有时以不稳定和不可预测的方式行事的理论理解做出了重大贡献。
解决AI视觉效果中的关键问题
实际上,本文有助于解释生成视觉AI系统中的一个主要问题: 为什么两个几乎相同的输入图像会产生截然不同的(有时是完全不现实)的外卖。 使用现代AI模型应用过滤器,样式或转换时,这种不一致的形状,身份损失或不希望的幻觉会表现出来。
对于消费者和创作者,这会导致挫败感,不可预测性和减少对AI工具的信任。
Glamai的创始人保罗·沙布罗夫(Paul Shaburov)说:“这个问题一直是视觉AI空间中的主要痛苦点,尤其是当现实主义和品牌完整性至关重要的时候。” “亚历山大的研究有助于建立一个理论基础来解释和解决这个问题,这是Glamai如何将应用工程与世界一流的研究结合起来以推动整个行业前进的一个很好的例子。”
这项研究很重要
作者介绍了一种新颖的方法来重建Fisher信息度量标准,该对象捕获了模型潜在空间的内在几何形状和曲率。他们表明,这个空间不是光滑的,而是分为不同的“阶段”。在这些阶段之间的边界上,模型变得高度敏感,导致较小的输入变化以触发输出的急剧变化。
简单地说:这项研究提供了一种几何方式来理解为什么模型可以突然“破坏”或在图像操纵过程中产生奇怪的结果。这种见识是迈向工程模型的关键步骤,工程模型本质上更稳定并提供可预测的高质量结果。它使像Glamai这样的团队能够更好地调整和控制模型行为,从而确保现实和预期的编辑结果。
这项研究在诸如生成摄影之类的领域中尤为重要,在这种领域中,用户期望具有自然和身份的视觉效果。训练良好的模型可能会扩大人的鼻子,误解照明或扭曲面部特征 – 所有这些都降低了AI生成的资产的商业和创造价值。
Glamai's Edge:研究 +现实世界的结果
Glamai的平台已经通过混合模型来解决这些挑战,该混合模型融合了开源基础模型,专有培训数据集以及旨在增强图像现实主义并保持身份的内部工具。 ICML 2025纸直接与Glamai的方法保持一致,并验证其技术方向。
Glamai的创始人Paul Shaburov说:“从影响者和内容创建者到新兴的独立品牌和全球时尚公司,我们的客户需要一致,情感共鸣且与品牌保持一致的图像。” “这项研究通过帮助我们的模型更具可预见的方式来支持我们的使命,并且更具人道的方式。我们看到了朝着现实的生成图像朝着逼真的趋势,而这项研究以及未来的其他研究是我们用来确切提供客户需求的技术堆栈的一部分。”
这种方法有所回报:Glamai每月有130万个活跃用户,并在App Store(2025年4月)的“照片和视频编辑”类别中排名最受欢迎的五个应用程序。
亚历山大·洛巴沙夫(Alexander Lobashev)对本文的贡献反映了格拉玛(Glamai)对不仅推进其产品能力,而且还提高为他们提供动力的科学的深刻承诺。
关于Glamai
Glamai是一个为影响者,内容创作者以及时尚和电子商务品牌构建的视觉AI平台。通过将高保真生成性AI与专有控制层和品牌安全架构相结合,Glamai可以立即帮助团队创建准备竞选活动的视觉效果,产品尝试,社交内容等 – 不需要照片拍摄,3D建模或数字艺术家。该公司致力于开放研究,透明度,并永远推动Visual AI的界限。
访问论文
标题:生成模型中潜在空间的Hessian几何形状
会议:ICML 2025
关联:
媒体联系
组织: Glamai
联络人: Kseniya Zakharova
网站:
电子邮件:
[email protected]
城市: 旧金山
状态: CA
国家:美国
发布ID:31256
ICML 2025上提出的Glamai研究贡献重点介绍了朝着更可靠和现实的AI生成的图像迈出的关键步骤,首先出现在国王Newswire上。该内容由第三方资料来源提供。国王Newswire不对与之相关的担保或陈述。国王Newswire是一家新闻稿分销机构,不认可或验证本新闻稿中提出的索赔。如果您有与本文有关的任何投诉或版权问题,请联系“媒体联系”部分中列出的公司
关键词: