Felix Pinkston
2025年6月18日14:45
NVIDIA利用CUDA-X数据科学来优化芯片制造工作流程,应对数据集不平衡和增强模型性能等挑战。
根据Divyansh Jain在NVIDIA开发人员博客上的最新博客文章的报道,NVIDIA在整合机器学习(ML)和数据科学方面处于革新其制造过程的最前沿。该公司利用其CUDA-X库来增强芯片制造工作流程,从晶圆制造到包装芯片测试,解决复杂的任务。
用ML优化制造
半导体巨头在其整个制造阶段都会产生数据核。将这些数据转换为可行的见解对于维持质量,吞吐量和成本效率至关重要。 NVIDIA开发了强大的ML管道,该管道解决了关键问题,例如缺陷检测和测试优化,利用CUDA-X库(例如NVIDIA CUDF和NVIDIA CUML)进行快速数据处理和模型培训。
解决班级失衡
以制造为重点的ML的一个重大挑战是处理不平衡的数据集,该数据集通过大多数单元通过测试,只剩下一小部分失败。这种不平衡会偏向模型培训。 NVIDIA通过采用有针对性的采样方法来解决这一问题,包括合成少数群体过采样技术(SMOTE)和分层采样,以平衡数据集。使用CUDA-X库加速了这些过程,从而可以直接在GPU存储器中进行有效的模型实验。
高级评估指标
在高度不平衡的情况下,诸如准确性之类的标准指标可能会产生误导。 NVIDIA使用诸如加权准确性和Precision-Recall曲线下的面积之类的指标来更好地评估模型性能。这些指标有助于强调模型的真正预测能力,从而确保误报最小化。
增强可解释性
除了性能之外,可解释性和可行性在操作环境中至关重要。 NVIDIA依靠CUML的功能重要性工具来识别供审核的高影响力功能,并有助于消除冗余测试步骤。此外,GPU加速形状实现提供了有关功能贡献的见解,增强了模型透明度和信任。
未来的方向
Nvidia继续扩大其在制造业中的ML功能,并有望在即将发布的博客文章中进一步见解。该公司计划探索高级功能工程技术和商业感知评估指标,旨在通过ML驱动的见解赋予运营工程能力。有关更多详细信息,请参阅NVIDIA开发人员博客上的原始博客文章。
图像来源:Shutterstock
(tagstotranslate)AI(T)加密(T)区块链(T)新闻
关键词: