Arize AI获7000万美元C轮融资,增强AI可观察性和LLM评估
人工智能(AI)可观察性和大型语言模型(LLM)评估领域的领导者Arize AI宣布了7000万美元的C轮融资,以加速其使人工智能在生产中可靠工作的使命。这一轮是人工智能可观察性领域有史以来最大的投资,由Adams Street Partners牵头,M12(微软的风险基金)、Sinewave Ventures、OMERS Ventures、Datadog、PagerDuty、Industry Ventures和Archerman Capital参与。现有投资者Foundation Capital、Battery Ventures、TCV和Swift Ventures也重申了他们对Arize愿景的信心。

人工智能的采用率正在飙升——2024年,企业支出超过138亿美元,68%的企业计划在2025年投资5000万至2.5亿美元用于生成式人工智能(GenAI)。然而,尽管人工智能模型比以往任何时候都更强大,但大多数LLM在语音助理等现实世界的应用程序中都难以可靠地执行。越来越多的尖端人工智能模型使用合成数据进行训练和优化,这些数据是由其他人工智能模型而不是现实世界来源生成的。但是,当这些模型无法准确评估其自身合成数据的结果时,会发生什么?
在一项名为OpenEvals的研究中,Arize证明,与非合成数据相比,LLM很难可靠地评估合成数据集的正确性,这是企业急于扩展生成式人工智能的一个主要盲点。这些发现突显了人工智能模型训练和自我改进循环中的严重风险,合成数据中未经检查的错误可能会随着时间的推移而加剧。对于工程团队来说,LLM仍然是一个黑匣子——不可预测、难以排除故障,并且容易出现可能破坏整个项目的故障。
随着该行业努力应对这些挑战,人工智能工程师需要更好的工具来确保他们的模型不会建立在有缺陷的基础上。借助Arize的AI可观察性和LLM评估平台,团队可以在故障升级为现实世界后果之前测试、排除故障并纠正人工智能系统。随着企业竞相实施半自主多代理系统、语音助理和日益复杂的面向消费者的人工智能应用程序,这一点尤为重要。
Arize AI的首席执行官兼联合创始人Jason Lopatecki表示:“构建人工智能很容易。让它在现实世界中工作是最困难的部分。企业不能部署不可靠的人工智能。工程团队需要更好的基础设施来测试、评估和排除模型对客户的影响。这正是Arize所提供的——无论是通过我们的企业平台Arize AX,还是我们的开源产品Arize Phoenix。”
Arize首席产品官兼联合创始人Aparna Dhinakaran补充道:“随着人工智能研究和现实世界应用的加速,Arize将继续开拓新工具,比如我们最近首次向市场推出的语音助手音频评估,以帮助从事这些系统工程的工程师更好地评估、调试和改进他们所构建的内容。”

自2020年推出以来,Arize已成为世界顶级企业和政府机构的人工智能可观察性和评估骨干,包括Booking.com、康泰纳仕、Duolingo、凯悦、百事可乐、Priceline、TripAdvisor、优步和Wayfair等数百家公司。该公司的开源产品Arize Phoenix已成为最广泛采用的人工智能可观察性和评估库,每月下载量超过200万次。
Arize与微软的合作关系也在扩大,M12的投资加强了长期的合作。该公司最近推出了与Azure AI Studio和Azure AI Foundry门户、SDK和CLI的更深入集成,使AI工程师比以往任何时候都更容易将可观察性和评估集成到他们的工作流程中。

Adams Street Partners合伙人Fred Wang表示:“我们认为,人工智能的可观察性是使人工智能真正为企业做好准备的缺失部分。”“随着人工智能应用的加速,公司需要强大、有凝聚力的工具来确保其人工智能系统的性能、可靠性,并与业务目标保持一致。通过我们在这个市场的研究和勤奋,我们相信Arize AI已经建立了人工智能可观察性和评估的类别定义平台,受到领先企业和人工智能优先组织的信任。我们很高兴在他们扩展以满足对生产级人工智能日益增长的需求时支持他们的愿景。”
M12管理合伙人Todd Graham表示:“Arize AI在AI可观察性和LLM评估方面的创新方法正在改变企业部署和管理人工智能系统的方式。我们的投资反映了我们对他们在行业中设定新标准的能力的信心,并使人工智能工程师和开发人员能够实现现实世界的结果。”。
Tripadvisor的数据和人工智能主管Rahul Todkar表示:“在人工智能搜索和推荐的世界里,Tripadviser的数十亿条评论和贡献变得更加重要,在这个世界里,旅行体验更具对话性、个性化甚至代理性。当我们构建新的人工智能产品和功能时,拥有合适的基础设施来评估和观察人工智能非常重要。Arize一直是这方面的宝贵合作伙伴。”
Booking的机器学习工程经理Jeroen Hofman表示:“借助GenAI,我们正在促进更量身定制的体验,比以往任何时候都更快地适应和响应旅行者的需求。随着我们不断创新,我们的技术团队将内部开拓新工具的方法与Arize等平台相结合,以帮助测试、评估和跟踪新的人工智能驱动的应用程序和工作流程。”
Swift Ventures普通合伙人Brett Wilson表示:“Arize AI在开创人工智能可观察性方面值得称赞,并为希望通过生成人工智能实现现实世界结果的企业创建了事实上的标准。”“我们很自豪能继续支持公司的发展。”