Neo4j图智能平台商业价值白皮书 (中文翻译版)
许多组织发现,其现有的数据架构难以应对现代数据与人工智能需求的复杂性。许多企业级数据架构最初的设计目的主要是以行列形式存储事实,而并非用于大规模地表示和查询这些事实之间的关系。未能充分理解数据间关系所带来的业务影响,可能表现为未被察觉的欺诈行为、隐藏的流程依赖关系、延迟的根本原因分析、监管合规风险、运营风险加剧,以及人工智能输出结果准确度降低且更难追溯至原始数据源。诸如欺诈检测、反洗钱、供应链分析以及数字孪生式运营视图等应用场景,都依赖于深入理解数据点如何跨越客户、账户、交易、产品、资产、供应商及运营事件相互关联。组织利用图技术,通过基于图的检索与遍历,为人工智能应用提供结构化且可解释的上下文。随着数据复杂性和人工智能工作负载的不断增加,一些传统的数据架构在处理关系密集型分析和多跳查询时,其扩展性会变得愈发困难。因此,组织纷纷采用Neo4j图智能平台,以连接复杂且高度关联的数据集,从而大规模支持这些应用场景,特别是在对性能、可扩展性和可解释性上下文的需求已超出以往解决方案的承载能力时。为量化Neo4j的商业价值,IDC开展了一项研究,探讨了组织使用Neo4j图智能平台连接和整理复杂数据、发掘隐藏关系以获得更深入洞察所带来的价值与收益。并提供必要的上下文,以提高人工智能模型的准确性和质量。通过采用业务价值方法论,IDC测算得出,研究参与者实现了IT、业务赋能及绩效方面的收益,每家组织每年平均价值达400万美元(相当于每支持一个由Neo4j提供的数据库或数据模型每年11.6万美元),三年期投资回报率达230%。•实现了此前其现有数据架构所无法支持的关键任务用例,包括实时决策、复杂依赖性分析以及即时模式检测。参与者一致认为,Neo4j是主要的推动因素,而非单纯的渐进式改进。•作为分析、知识图谱和人工智能项目的长期骨干,通过提供结构化且可解释的上下文,提升洞察质量,并支持不断演进的业务用例,而无需进行重大架构重构。•通过提供可靠、高可用的架构,支持企业实现可扩展性和运营稳定性,该架构可跨云、本地部署进行扩展。•通过将分散在各个孤岛中的数据连接起来,构建一个统一、连贯的企业图谱,从而实现对多源数据的深入理解、可追溯性和推理分析。•允许开发团队在数据库本身中定义业务规则和多跳推理,为大型语言模型提供一种确定性的替代方案,同时为代码提供一种更敏捷、更灵活的替代方案,从而加快变更与交付速度。通过托管云服务和灵活的部署选项,简化数据库操作,降低风险、减少成本,并助力实现成本可预测性。各组织正在扩大人工智能项目,并致力于在运营与分析用例中应用互联数据。在许多此类环境中,团队往往需要处理以网络、层级/树状结构以及路径/旅程形式自然呈现的数据;这些数据的含义取决于跨多个实体和领域的关联关系。与此同时,随着查询多样性的不断增加,以及对理解上下文和跨数据关联能力的需求日益迫切,许多组织正努力使数据更“适合人工智能”。这一趋势有助于各组织更好地支持人工智能项目,推动其从实验阶段迈向生产部署阶段。在一系列业务和运营场景中,以关系为导向的需求正变得日益迫切。例如,欺诈检测和反洗钱用例便聚焦于识别各类模式,如诈骗团伙、循环支付以及瓶颈识别,这些模式可应用于运营流程分析和供应链优化。一些组织还应用基于图的算法可用于构建互联网络的数字孪生模型,例如汽车、飞机及其他复杂系统的交通系统,以实时或近实时地理解约束条件并作出响应。这些用例中的许多都涉及重大的财务或监管后果,因此,准确性、速度和可解释性不仅是性能目标,更是直接关乎风险与运营韧性的业务需求。随着数据量和关系复杂性的增加,这些用例很难再通过以往的数据架构方法持续地加以支持。团队可能不得不依赖大量连接的workaround和应用层处理,以呈现关联实体并执行多步骤遍历。这些方法会增加开发复杂性,影响性能,并使系统更难适应业务和数据需求的演进。相比之下,基于图的模型为表示和演化关联数据提供了一种更为灵活的解决方案。在此背景下,各组织正在评估基于图的平台,以更直接地表示互联数据,并借助灵活、标准且简洁的查询语言,支持多种多样的查询模式,而不再依赖于以往架构中常需采用的大量连接操作的变通方案及应用层逻辑。这是因为用例的核心数据天然呈现为一个或多个网络、层次结构/树状结构、路径/旅程或其他互联的复杂结构。此外,一些组织还正利用知识图谱和基于图的检索方法,为人工智能和生成式人工智能应用提供更结构化的背景信息,从而提升模型的可解释性。据多方观察,这种模式正迅速成为企业界一项重要的AI应用范式。许多商业问题都取决于对客户、账户、交易、供应商、资产、系统和事件之间关联关系的理解。Neo4j图智能平台基于原生图数据库构建,用于存储、管理和分析这些环境中高度互联的数据。在这些环境中,重要的模式往往源自各实体之间的关系,而不仅仅是单个记录本身。灵活的图数据模型以节点和关系的形式存储数据,这种模式在团队需要遍历并分析多层关联关系时尤为常见。人员、账户、交易、设备、系统及其他业务对象,以及当关系深度和查询模式发生变化时。该平台的核心是一个原生图数据库和Cypher查询语言,它们使团队能够更直接地表达基于关系的问题和业务逻辑,从而减少对大量连接的workaround以及应用层处理的依赖。Neo4j的图原生处理功能支持高效遍历关联数据,即使在查询需要跨越高度相关性的多度连接时亦然。实体。在实践中,组织利用这些功能支持诸如欺诈检测、依赖关系与影响分析、供应链映射以及关联搜索等工作负载,其中查询模式往往会随着业务问题的深入而不断演变。Neo4j图智能平台根据组织需求采用不同的运营模式进行部署。Neo4jAuraDB提供完全托管的云端图数据库选项,其功能旨在通过托管式资源调配和自动化维护(如升级与备份)来减少日常管理任务。此外,组织还可以在云端、本地以及混合环境中以自管方式运行Neo4j图数据库,以契合其治理、安全及数据驻留等方面的要求。Neo4j还被用作知识图谱项目和人工智能相关工作负载的基础。组织可利用它连接跨领域的数据,为分析、人工智能及生成式人工智能应用提供结构化且可追溯的背景信息,包括采用基于图的检索模式的实现方案,以帮助支撑答案的依据,并提升可追溯性和可解释性。在这些场景中,该平台可作为知识图谱基础,助力生成更具可解释性和情境感知的人工智能输出。•基于图的数据建模:直接表示实体和关系,以支持基于关系的分析、关联查询以及在高度连接的数据集中的多跳遍历。•知识图谱与人工智能支持:采用基于图的检索和知识图谱方法,为分析、人工智能及生成式人工智能用例提供结构化且可追溯的上下文。•密码查询语言:使用声明式语言来表达图应用中的遍历、模式和业务逻辑•连接数据的原生遍历:支持多跳遍历以及针对高度连接数据集的复杂关系查询。•图算法:应用图算法识别模式与关系,以用于实体解析、路径优化及其他关联数据分析等用例。•托管云服务选项:使用Neo4jAuraDB,通过托管式配置和自动化维护来降低运营开销。•自管理与混合部署:在云端、本地或混合部署中运行Neo4j图数据库,以契合您的基础设施和治理需求。IDC开展了一项研究,探讨了各组织使用Neo4j图智能平台连接和整理复杂数据所带来的价值与优势,以提升模型的准确性和质量。该项目共进行了九次访谈,采访对象均为使用Neo4j并具备该平台相关经验和知识的组织。在访谈过程中,研究人员向这些公司提出了大量定量和定性问题,涉及该产品对其核心业务、数据库环境以及成本等方面的影响。表1(见下文)列出了研究参与者的公司概况。这些公司的平均全职员工人数为60,444人,年收入为368亿美元,IT团队成员数量为3,879人。这些公司分布于不同的地域和行业领域。更多相关指标请参见下文。受访机构选择Neo4j,旨在实现人工智能与机器学习的集成,连接复杂且高度相关的数据集,并克服以往数据库技术在性能和可扩展性方面的局限。许多机构亟需一种图数据库,能够对跨领域的复杂关系进行建模,例如科研、临床报告、制造以及供应链等领域。Neo4j缩短报告周期、降低监管与运营风险、提升数据一致性的能力,成为这些机构的重要差异化优势。此外,稳定性和高可用性也是决定性因素,尤其对于那些要求系统具备强大韧性的关键任务环境而言更是如此。多环境部署。总体而言,各组织选择Neo4j是因为其可扩展的图架构、卓越的性能,以及支持高级分析和人工智能驱动用例的发展路线图。人工智能/机器学习赋能(化学):“我们的主要目标是利用Neo4j图数据库提升性能,并实现人工智能与机器学习的集成。我们此前已有限度地使用过Neo4j,因此为了应对这一挑战,我们升级了订阅服务,并与他们密切合作,将所有系统与人工智能和机器学习无缝连接并集成到这种类型的数据库中,以此作为我们的首要目标。”连接复杂数据集的能力(制药):“我的公司需要一家在图数据库管理市场中值得信赖的供应商,而Neo4j尤其擅长处理围绕早期药物发现的复杂、高度互联的数据集。我们还在全球生产和供应链中采用图分析方法进行假设情景分析,利用基于图的方法提升聊天机器人的效率,以及追踪ACP互动以更好地理解处方行为。”缩短报告周期并降低风险的能力(生命科学)):“Neo4j主要应用于临床与研发数据集成领域,包括药物发现和知识图谱项目。我们管理着数以万计的临床研究,这些研究涉及复杂的元数据和依赖关系。我们亟需从分散的电子表格、关系型数据库以及SaaS系统转向Neo4j,以减少人工报告工作,缩短报告准备和质量控制的周期,并降低因提交材料中数据不一致而带来的监管风险。”更高的稳定性(电信):“过去四年,我们一直使用Neo4j,选择它的首要原因是其稳定性。我们还喜欢它平台的可靠性,以及它为我们提供了一份可循的路线图。此外,它还满足了我们在本地多数据中心模式下所需的高可用性和架构可扩展性。”性能改进(制造):“归根结底,选择Neo4j的决定性因素是其性能。我们的工厂管理着高度复杂、树状结构的装配数据,机器人需要实时访问特定零部件。此前,每次调用最多需耗时两分钟,这在实际生产线上根本无法实现。自2023年初实施Neo4j以来,我们不仅成功满足了这些性能需求,还引入了此前无法实现的新质量检测功能。”可扩展性(专业服务):“我们此前采用的是另一种技术栈来构建这款产品,但其性能和扩展性均未达到预期,这实际上阻碍了项目的进展。我们评估了其他数据库,最终选择了Neo4j。”表2(见下文)展示了Neo4j所支持的数据环境。平均而言,Neo4j支持或优化了35个数据库或数据模型。这些数据库的平均数据量为279TB。此外,Neo4j还支持39个应用程序和15种算法。总计有2,572名员工正在使用这些应用程序以支持他们的工作项目。更多相关指标如下所示。随后,IDC深入调研,要求参与者描述Neo4j所支持的用例。以下列表概述了在所有九位受访客户中最具影响力的用例:•用于研究、运营和业务领域的知识图谱:客户构建了知识图谱,以表示复杂实体,例如研究、产品、资产、患者、供应商或客户,以及它们之间的关系。这些图表充当了记录系统,用于了解数据、流程和结果之间的关联。•实时依赖与影响分析:各组织利用Neo4j实时分析依赖关系,从而深入了解系统某一环节的变更、故障或约束如何影响下游流程。这有助于开展假设分析、快速决策以及采取运营响应措施。•临床、监管与报告工作流程:客户使用Neo4j对涉及文档、数据集、版本及衍生输出的端到端工作流程进行建模。这实现了可追溯性,减少了人工操作,并提升了复杂报告与提交流程的一致性。•生产、资产与装配线跟踪:Neo4j可对层级化、树状结构进行建模,例如装配体、零部件以及生产步骤。这使得在制造和运营环境中能够实现实时验证、质量检查、根本原因分析以及可追溯性。•供应链、网络与库存建模:客户将供应链、网络和库存表示为相互连接的图,以了解路由、可用性和依赖关系。这有助于规划、预测以及快速评估整个网络中的中断或变化。•人工智能、生成式人工智能和GraphRAG应用:各组织利用Neo4j为人工智能和生成式AI系统提供结构化、可解释的背景环境。客户将图查询与语言模型相结合,以提升推理能力、减少不一致的输出,并实现对系统的自然语言访问。复杂数据。•客户、用户与互动分析:Neo4j对客户、用户、互动和行为之间的关系进行了建模,以洞察用户旅程、影响模式及参与度。这为个性化服务、推荐以及基于洞察的决策提供了有力支持。•SaaS平台与多租户数据架构:客户将Neo4j用作SaaS和内部平台的核心数据层,为每个客户或用例构建图谱。自动化、一致的性能以及灵活的扩展能力助力业务增长,而无需重新架构数据层。具体聚焦于生成式AI用例,IDC发现,在接受访谈的四家组织中,有四家利用Neo4j来强化其生成式AI举措。这些组织借助该平台,将大型语言模型嵌入结构化的知识图谱,并实现企业上下文的无缝衔接。通过将Cypher查询与基于图的检索方法相结合,团队得以以自然语言方式访问复杂且高度互联的数据集,同时提升了推理准确性和上下文相关性。受访组织表示,他们利用Neo4j将分散的文档、运营数据和领域知识整合到统一的图层中,从而增强了对人工智能生成答案的信任度。进一步说明了Neo4j在生成式AI推广中的重要作用,这四家组织指出,知识图谱驱动了其生成式AI用例的43%。尤为重要的是,通过将生成式AI用例构建于Neo4j之上,这些组织发现该平台显著降低了幻觉现象,降幅高达44%,并提供了更加一致且可解释的输出结果。这些组织还报告称,Neo4j已成为提升其生成式AI应用质量、可靠性和可扩展性的基础性组件。研究参与者认为,使用Neo4j最显著的三大优势是稳定性、可扩展性和性能。各组织报告称,Neo4j提供了高可用性,使关键任务系统能够持续稳定运行,同时支持不断增长的数据量以及日益复杂的关联关系。此外,Neo4j原生图数据库架构和无索引邻接方式带来了显著的提速效果。读取性能尤其在需要频繁访问数据的环境中至关重要。图模型的灵活性以及Cypher查询语言的强大功能,使团队能够直接在数据库内重构和优化业务逻辑。这加快了变更实施速度,同时降低了运营风险。对于使用AuraDB的用户而言,托管式功能简化了基础设施的管理,并提供了更清晰的成本控制。稳定性和可扩展性(电信):“稳定性和可扩展性是Neo4j的关键优势。我们几乎实现了零停机,显著降低了计算负载,同时也节省了能源。Neo4j灵活的图模型还使我们能够更快地应对变化和新功能的部署;我们的项目周期已从九个月缩短至两个月。此外,性能也得到了大幅提升——在电信领域,快速且无需索引的读取至关重要。数据在网络中只需写入一次,却要被读取数百次,因此我们必须以更快的速度完成这一过程。这为我们带来了更高的吞吐量和更迅速的业务执行效率。”可扩展性(专业服务):“数据治理是我所在团队的核心职能;如果数据治理无法实现规模化,那么我的公司和客户也无法实现规模化。通过迁移到Neo4j,我们为实现大规模扩展打开了大门。”性能(技术):Neo4j的突出优势在于其性能,与其他选项相比无出其右。尽管有些方案运行起来更为便捷,但都无法达到我们所要求的水平。Neo4j使用起来十分简便,使我们无需再自行管理数据库基础设施;而且,它的产品路线图——尤其是针对生成式AI领域的规划——比其他替代方案更加完善。精准业务逻辑(专业服务):“Neo4j使我们的公司能够将产品部署到一个更具性能扩展性的技术栈上。因此,我们得以对数据模型和业务逻辑进行彻底重构和重新设计,从而充分利用Neo4j的优势,进一步提升系统性能。此外,它还帮助我们对代码进行了模块化处理,更精准地封装了大量业务逻辑,这使得我们能够更快地识别变化,并以极小的风险迅速实施这些变更。”更高性能,更少管理(能源):Neo4j的关键优势在于,它能够轻松扩展并部署解决方案,而无需担心性能或日常管理问题。真正重要的是,我们深知它无需太多努力就能持续保持出色表现。自动扩展的成本可预测性(制造业):Neo4j的一大优势在于,我们能够更好地控制成本。我们可以明确界定内存使用情况,从而清晰地了解如何进行扩展。如今,自动扩展功能已成功实施,因此我们可以在不改变成本的情况下提升资源消耗。图1(下文)展示了IDC对采用Neo4j图智能平台后累计客户收益的测算结果。如所示,以下各类别中,每家机构的平均年度收益量化为400万美元(每套由Neo4j支持的数据库或模型为11.6万美元):•IT优势:各组织通过整合传统系统、利用AuraDB等托管服务,以及采用自动化和基于Cypher的建模方法,降低了基础设施复杂性并减少了管理开销,从而简化了IT和数据工程团队的部署、扩展及日常数据库管理工作。•业务赋能优势:参与者通过启用图驱动的应用程序,加快产品上市速度,支持个性化决策,并借助自动化和更高效的工作流程减少招聘需求,从而发掘了新的收入机会并改善了运营成果。•性能优势:原生图架构和无索引邻接显著提升了查询速度、响应时间以及整体系统稳定性,使组织能够支持实时用例,并以一致的可靠性扩展复杂、高度互联的数据环境。Neo4j的业务赋能优势IDC观察到,Neo4j通过支持新收入增长、加快产品上市速度以及提升生产力,带来了可观的业务赋能效益。受访企业表示,收入增长得益于基于图技术的应用,这些应用实现了个性化定制、优化了促销活动、提升了产品质量,并支持了数据驱动型服务的快速推广——而此前,性能瓶颈曾制约着这些服务的部署。通过充分利用原生图建模功能,Cypher查询和知识图谱功能将分散的数据连接起来,提升了决策的准确性,并解锁了诸多用例,直接促进了销售业绩和客户满意度。与此同时,通过AuraDB等托管服务实现自动化,以及精简图数据管理流程,减少了对额外人员的需求,使现有员工能够专注于更具价值的业务活动。这些综合能力转化为更高的净收入、更低的运营overhead以及更高效的运营流程,从而提升了整体业务表现。收入增加(制造业):“我的公司在使用Neo4j后实现了收入增长。在为期六周的试点中,收入提升了44%。此外,我们还受益于更高的后台运营效率以及更短的上市时间。”更高的客户满意度(制造):“Neo4j为我的公司提供了实时洞察与数据。这提升了车辆质量,也提高了最终客户的满意度。”收入增加(技术):“我的公司借助Neo4j的收入确实在持续增长,预计未来还将进一步扩大。目前,我们通过Neo4j已实现约400万美元的收入。”IDC通过首先评估Neo4j对收入的影响,验证了这些报价。受访机构发现,该平台通过加速图驱动型应用的部署,并释放此前受数据复杂性和性能限制而无法实现的用例,成功推动了可观的收入增长。平均而言,各机构每年新增的毛收入达到6,737,151美元,这一增长主要得益于个性化水平的提升、决策效率的增强以及新服务的快速推广(表3,见下页)。按照15%的运营利润率计算,这相当于在IDC模型中每家机构每年新增1,010,573美元的净收入。这些成果体现了Neo4j在连接分散数据、实现实时洞察,以及助力团队更快速、更精准地把握机遇方面所发挥的作用。受访机构还发现,Neo4j有助于实现可观的运营成本节约。它们通过精简的数据集成实现了这些效率提升。减少了手动流程,并能够利用现有团队支持不断增长的工作负载。通过简化复杂的数据环境并提升可扩展性,Neo4j帮助各组织在控制成本的同时持续拓展业务能力。如表4(下文)所示,此举避免了招聘5.9个全职当量员工的需求,从而每年节省运营成本596,606美元。研究参与者还借助Neo4j的原生图架构和无索引邻接功能,在大规模高连接数据中实现了显著的性能提升,从而高效地进行图遍历。参与者反馈称,查询执行速度更快、响应时间更短、事务处理速率也更加稳定。这使得原本无法在传统关系型或旧有系统中实现的实时工作负载成为可能。在复杂环境中,Neo4j大幅提升了系统的整体性能,随着数据量和关系规模的扩大,查询速度与稳定性均得到了明显改善。此外,Cypher查询语言通过支持团队直接在数据库内建模并优化业务逻辑,进一步提升了性能,减少了对大量联结操作的依赖以及对应用层处理的过度需求。这些能力使各组织能够更好地支撑关键任务运营。随着其数据生态系统规模和复杂性的增长,加速吞吐量并保持高可靠性。性能与可扩展性(生命科学):与传统数据库相比,如今的扩展性已呈指数级增长,随着节点和关系数量的增加,性能也大幅提升。我们能够更快地解答复杂问题,在大型发现数据集上查询速度最高可提升100倍,而在小型生产系统中,查询速度也能提高5到6倍。开发促进器(制造):“Neo4j为我们应用开发提供了重要支持,因为如果没有它,我们的一些质量保证应用根本无法实现。尤其是实时阻断用例和即时模式检查,若没有Neo4j,这些功能根本无法落地。”密码查询语言(专业服务):我们开发查询以支持业务逻辑,而Cypher查询语言功能极其强大。它使开发人员能够快速进行更改,并随着我们需求的变化灵活调整。更快的开发与采用(技术):“Neo4j真的为我们的开发人员提供了很大帮助,尤其是让他们能够快速验证概念并迅速搭建数据库。此外,由于其新功能拥有完善的文档支持,上手也十分便捷。”为量化该平台的性能优势,IDC研究了它如何在关键运营指标上实现可衡量的性能提升,具体参见图2(下文)。平均而言,各组织报告查询速度提升了53%,响应时间缩短了43%,从而能够更快地执行复杂工作负载。事务处理速率提高了38%,而整体系统性能则提升了31%,充分展现了吞吐量和可靠性的全面提升。这些计算得出的KPI凸显了Neo4j在关键任务环境中提升一致性、降低延迟以及支持实时数据访问的能力。除了上述强劲的KPI指标外,IDC还发现,Neo4j对受访组织中开发人员的生产力水平产生了显著影响。Neo4j图智能平台使团队能够直接建模关系,利用Cypher清晰地表达业务逻辑,并能快速搭建和迭代基于图的应用程序,而无需复杂的模式设计或依赖繁重的联接操作来规避问题。如表5(见下页)所示,这一举措使生产力提升了28%,使得由25.2名开发人员组成的团队,其工作效率相当于额外增加了7.2个全职员工。IDC将这一收益估值为每年716,052美元。受访机构表示,Neo4j通过实现数据环境部署、管理和优化的现代化,带来了显著的IT优势。通过使用Cypher查询语言将业务逻辑直接封装在图数据库中,团队不仅提升了性能,还减少了对复杂应用层workaround的依赖。诸如AuraDB之类的托管服务则简化了资源调配流程。通过自动化部署、提供基于API的扩展功能以及内置高可用性,极大减少了对持续基础设施管理的需求。与会者还强调了数据摄入速度加快、数据准确性提升以及跨系统集成流程的简化,从而降低了人工操作负担并减少了对传统工具的依赖。依赖关系。这些功能共同提升了运营效率,并为企业数据与分析工作负载提供了更稳定、更具扩展性的基础。业务逻辑优化(专业服务):“Cypher是一种功能极为强大的查询语言,配合Neo4j和AuraDB,它使我们能够对业务逻辑进行建模和优化,从而实现极高的性能。与我们之前的的技术栈相比,它还为我们提供了更大的灵活性,让我们在数据建模方式以及可执行的查询类型上有了更多选择。”更高性能(制造):“借助Neo4j,数据导入速度极快,准确性更高,部署也更迅速。”减少人工投入(制造):“对我们而言,Neo4jAuraDB非常棒,因为只需按一下按钮,它就能立即投入使用,而且只需我们付出极少的努力即可完成优化。”自动化数据库规模调整(技术):我们选择了完全托管的AuraDB选项,并根据客户使用情况自动调整数据库规模。这使我们能够高效部署,而无需构建复杂的自动化流程来管理数据库。所有操作均通过API驱动并实现全面自动化,因此我们可以轻松地将服务规模从100个客户扩展到数千个客户。自动化部署(能源):“部署对我们来说不是问题,因为所有流程都已通过AuraDB实现自动化。如果没有这一点,部署将真正成为一大挑战。我们无需专门的基础设施资源来监控用量或部署情况,因为整个系统就是管用”。生成式AI(生命科学)的骨干:“Neo4j已日益成为我们生成式AI计划的核心数据支柱,为模型提供了结构化且可解释的上下文。此外,使用Neo4j还将大语言模型的幻觉发生率从大约20%至40%大幅降低至约2%至5%。”整合整合(生命科学):我们在这一过程中节省的主要在于工具和集成成本。此前,我们每年花费约200万美元,使用多个数据库来支持临床工作流用例;采用Neo4j后,我们整合了这些集成。IDC通过量化Neo4j对IT成本的影响,验证了这些定性研究结果。受访机构表示,通过整合数据平台、淘汰老旧系统以及简化复杂环境中的集成与运营开销,其年度IT支出得以降低。一位电信行业参与者指出:“借助Neo4j,我们关停了不少传统系统。Neo4j使我的公司能够整合所有库存,从而避免重复。”根据汇总的访谈数据,IDC测算出,每家机构每年平均可节省的IT成本约为100万美元。IDC接下来评估了Neo4j对管理平台所依赖基础设施的人员所产生的影响。该团队从平台提供的托管服务、自动化功能以及内置的高可用性特性所带来的简化部署与运维中获益良多。这减少了组织在配置、扩展、打补丁和维护图数据库方面所需的时间和人工投入,与之前的环境相比有了显著降低。如表6(下文)所示,这些改进使IT基础设施团队的工作效率提高了39%,这意味着与以往的管理方式相比,他们所需的全职等效人员减少了8.4个。这为团队腾出了更多时间,使其能够专注于其他重要的业务举措,例如创新。IDC将这一效率提升的价值评估为每年835,653美元。在上述IT基础设施管理效率的基础上,IDC研究了Neo4j对数据库管理效率的影响。参与者报告称:该平台通过大幅缩短日常管理任务所需时间,显著提升了DBA的工作效率。图3(见下一页)显示,各组织在图数据库维护效率上实现了63%的提升,在补丁更新活动中的效率也提高了61%。这充分体现了自动化与图原生设计所带来的优势。此外,采用Neo4j还简化了部署和迁移流程,多项指标的效率提升均超过55%。这些关键绩效指标的改善表明,Neo4j提供的托管功能与简化的架构有效减轻了管理负担,使DBA团队能够将更多精力投入到更具价值的项目中。DBA效率(表7,下一页)。研究参与者发现,该平台降低了DBA的工作负荷,因为其图原生设计、自动化功能以及托管能力,将数据库环境的管理、扩展和维护所需的工作量降至最低。这些改进使DBA团队的工作效率提升了52%,这意味着与以往方法相比,他们管理现有环境所需的全职等效人员减少了4.9个。IDC将这一效率提升的价值评估为每年488,074美元。针对研究参与者使用Neo4j图智能平台所带来的财务与业务相关收益,IDC计算出了平均投资回报率。如表8(见下文)所示,IDC估计,通过提升IT效率、改善性能以及赋能业务,这些公司实现了平均每个机构三年期的贴现收益达960万美元。这一收益水平与每个机构三年期的总贴现成本290万美元形成对比。上述收益水平与投资成本共同促成了平均三年期投资回报率高达230%,投资回收期仅为7.8个月。随着组织将数据和人工智能项目规模化投入生产,对处理以网络、层级和旅程等自然形态呈现的现实世界数据,并提供可解释、富含上下文的洞察的需求也日益迫切。碎片化的数据会拖慢团队进度,增加重复工作,并使跨运营与分析用例重用上下文变得更加困难。随着组织从孤立的用例转向更广泛的运营应用,它们通常会寻求能够跨领域连接数据、维护治理与复用,并提供一致的“知识与上下文层”的解决方案,以同时支持运营和分析需求。决策制定与分析发现,同时有助于减少因数据孤立而造成的延迟和低效,这些因素可能会影响运营成本和实现价值所需的时间。对于正在构建人工智能和生成式人工智能项目的组织而言,常见的优先事项包括:通过提升数据质量和一致性,使数据更便于AI应用;统一定义和元数据;明确所有权归属;以及追踪数据仓库、数据湖和运营系统中数据的依赖关系和来源。在这些环境中,团队需要确保人工智能系统所使用的上下文能够被管控、更新,并可追溯至源系统,以支持可解释性和数据溯源,尤其是在输出结果用于决策或面向客户的互动时。与此同时,组织还必须解决一些实际问题,例如培养相关技能、与现有平台进行集成,以及确定哪些用例值得投资于全新的数据建模与检索方法,而非继续依赖现有的数据架构。这些动态为实现连接数据项目的标准化创造了机遇,具体做法是构建一个可复用的知识图谱或知识层,以链接各系统中的数据,并支持基于上下文的应用及挖掘隐藏或复杂原因的各类工作。一些组织还在探索基于图的检索模式,包括GraphRAG方法,以便为人工智能应用检索结构化、关联化的上下文信息,从而提升模型的准确性和可解释性。此外,部分组织还可能尝试借助生成式AI辅助的方法,加速初始知识图谱的创建过程,降低起步阶段所需的工作量。从运营角度来看,基于图的平台能够支持或拓展那些依赖多步骤关系分析的用例。包括金融犯罪与欺诈模式检测、依赖关系与影响分析,以及复杂流程中的瓶颈识别。IDC的研究强调,在当前环境中,组织借助Neo4j图智能平台能够实现巨大价值。在这些环境中,互联数据、基于关系的分析以及对人工智能准确性和可解释性的高要求,已难以通过以往的架构来有效支撑。为助力应对上述挑战,Neo4j图智能平台非常适合作为基于图的底层框架,用于呈现互联的业务情境,并支持可复用的人工智能知识层。组织利用该平台连接分散的数据,支持各类应用场景,包括欺诈检测、依赖性与影响分析、供应链与运营建模、知识图谱,以及部分生成式AI相关项目。使用Neo4j的组织报告称,在业务赋能、业务敏捷性、性能以及IT效率方面均取得了显著成效,包括查询和响应时间更快、开发人员生产力更高,以及基础设施和DBA工作量更低。在将Neo4j应用于生成式AI相关用例的组织中,还报告称其AI准确率得到提升、输出一致性增强,幻觉发生率也有所降低。总体而言,IDC测算显示,采用Neo4j的组织平均每年可实现400万美元的效益(每支持一个数据库或模型可获11.6万美元),三年投资回报率达230%,投资回收期仅为7.8个月。•IDC在该项目中采用了其标准的投资回报率(ROI)方法。该方法以收集Neo4j现有用户的数据作为模型的基础。根据对使用Neo4j的组织的访谈,IDC采用了一个三步流程来计算投资回报率和投资回收期:1.IDC在访谈过程中收集了定量效益信息,采用的是对Neo4j实施前后影响的对比评估。在本研究中,所涉及的效益包括IT成本的降低与避免、员工节省的时间及生产力提升,以及收入增长。2.IDC根据访谈结果,编制了一份完整的投资(三年总成本分析)报告。这些投资不仅包括使用Neo4j的初始成本和年度成本,还可能涵盖与迁移、规划、咨询以及员工或用户培训相关的额外费用。3.IDC计算了投资回报率(ROI)和投资回收期。IDC对各组织在三年内使用Neo4j所获得的收益与投资进行了折旧现金流分析。投资回报率是净现值与贴现后投资之比。投资回收期是指累计收益与初始投资相等的时点。IDC的投资回收期和投资回报率计算基于一系列假设,这些假设总结如下:•时间值乘以负担薪资(薪资+28%的福利及管理费用),可量化效率与生产力的节省。在本次分析中,IDC采用了IT人员的平均全职薪资为每年10万美元,非IT人员的平均全职薪资为7万美元。IDC假设员工每年工作1,880小时(47周×40小时)。•IDC通过从组织原本将这笔资金投资于年收益率为12%的金融工具所能获得的收益中减去这一金额,来计算三年节省额的净现值,从而考虑了错失的机会成本。这既反映了资金的假设成本,也体现了假设的回报率。•此外,由于Neo4j需要一段部署期,在部署期间无法完全实现该解决方案的全部优势。为反映这一实际情况,IDC按月对效益进行比例计算,然后从第一年的节省额中扣除部署所用的时间。