智能公司为什么跳过清洁数据:您的竞争对手可能已经知道的AI秘密:埃里卡·安德森(Erica Andersen)


数字化转型顾问为您撒谎。他们已经说服了各地的高管,甚至在您甚至可以考虑AI之前,您需要踏上一个长达数月(或数年的)数据清洁奥德赛。清洁一切!标准化一切!使它完美!

它很昂贵,耗时且最糟糕的是,它完全倒退了。

出色的数据清洁骗局

这是真正发生的事情:咨询公司发现了完美的商业模式。告诉公司他们需要首先清理所有数据,为工作收取溢价费率,并享受没有明确端点的项目。您怎么知道数据何时“足够干净”?你没有。球门柱继续前进,发票不断到来,与此同时,您的竞争对手已经在使用AI来解决实际问题。

这不是无能 – 这是一项功能,而不是错误。数据清洁项目是顾问金矿,因为它们几乎无法完成,甚至更难衡量成功。

为什么完美的数据是神话

让我们残酷诚实:您的数据永远不会是完美的。不可能。为什么:

您的数据正在不断变化。 当您花了六个月的时间清洁历史仓库数据时,新的库存正在到达,项目正在移动,规格正在更新。到完成时,您的“干净”数据集已经过时了。

您还不知道“干净”的意思。 在您确切了解如何使用AI系统之前,您不知道如何准备数据。您可能会以几个月的方式将产品类别标准化,只是发现您的AI应用程序需要完全不同的分类。

不平衡的数据集使大多数清洁无关。 您可能拥有世界上最原始的数据,但是如果您有10,000个示例,其中有50个示例,其中大多数完美清洁的数据对于培训都是没有用的。

干净的革命

聪明的组织正在采用一种根本不同的方法:他们只清理所需的东西,在需要时,对于他们构建的特定AI应用程序。

这是其工作原理:

从您的AI用例开始,而不是您的数据。 准确定义您要解决的问题以及AI需要完成的问题。只有这样,您才能查看实际需要的数据。

让AI帮助清洁数据。 尖端的AI系统非常擅长处理混乱,不完整的数据。他们可以填充缺失的值,标准化格式,甚至比传统数据清洁工具更好地识别不一致之处。

策展人,不要清洁一切。 与其尝试完善整个数据集,不如为您的特定AI应用程序创建重点,高质量的子集。这会产生更好的结果。

接受迭代的改进。 从您拥有的东西开始,看看有效的方法,然后根据实际绩效需求清洁和逐步改进。

现实世界的例子

考虑仓库管理系统。传统方法说,您需要在启动之前跟踪每个项目的尺寸和重量信息。这可能需要几个月的时间,并花费一笔大巨款。

聪明的方法?使用AI根据可用数据,产品类别和类似项目来估算缺失的信息。部署系统,让它从实际操作中学习,并通过实际使用一段时间来提高数据质量。

或者让我们获取客户数据。与其花费一年的时间标准化每个客户记录,不如从您实际与之互动的客户开始。随便清洁,专注于对特定AI应用程序至关重要的数据。

瑞士奶酪原理

AI系统不需要完美的数据 – 它们需要适当的保障措施。将其视为瑞士奶酪模型:每一层保护(人类监督,验证规则,AI信心评分,商业逻辑检查)涵盖了其他层中的孔。

您的数据质量只是此系统中的一层。与其尝试使其变得完美,不如使其变得足够好,并专注于围绕它建立强大的保障措施。

底线

以AI获胜的公司不是具有最清洁数据的公司,他们开始最快,学到最快的公司。尽管他们的竞争对手仍在辩论数据治理框架,但他们已经处于工作系统的第三次迭代。

停止让顾问将您的AI倡议掌握人质,人为人质。您的数据不需要完美。它只需要足够好即可开始,并计划通过实际使用来改进它。

未来属于拥抱“随着您走的干净”并开始建立AI系统的组织,而不是为了为完美的明天做准备的那些组织,这将永远不会来。

开始混乱。立即开始。在学习时清洁。您的竞争对手已经在这样做了 – 他们不在等待完美的数据来获得

(tagstotranslate)FineXtra(T)新闻(T)在线(T)银行(T)银行(T)技术(T)技术(T)财务(T)财务(T)Financial(T)Fin(T)Tech(T)Tech(T)Fintech(T)Fintech(T)IT(T)IT(T)破坏(T)最新(T)最新(T)最新(T)零售(t)零售(T)t剥夺(t)贸易(t)执行(t)头条新闻(t)区块链(t)数字(t)投资(t)移动(t)业务(t)挑战者(t)付款(t)付款(t)Regtech(T)Regtech(T)Insurtech(T)Insurtech(t)服务



关键词:

Andersen智能公司为什么跳过清洁数据您的竞争对手可能已经知道的AI秘密埃里卡安德森Erica
Comments (0)
Add Comment