几个工程师、一个星期,就能做一个AI Agent应用了。
效果be like——
能理解用户复杂长命令,推荐符合要求的奶茶店。
要知道,这背后需要它能分析处理不同模态的数据,比如文本、地理信息、图像等。
放在以前,构建这样的AI应用需要多个不同的数据库,还需要配备经验丰富且规模较大团队来管理复杂技术栈。
如今,能如此轻松搞定,多亏了背后的一体化数据库。
最新发布会上,OceanBase推出首个面向实时分析处理场景的GA版本:4.3.3版本。
不仅推出全新 向量检索 功能,实现 SQL+AI一体化 ,还进一步增强 多模态数据处理能力 。
感觉方方面面都是为AI时代做好了准备啊。
为啥能这么说?
从最新发布的新能力看起。
首个面向实时分析的GA版本
此次OceanBase 4.3.3核心升级的能力主要有3方面:
首先,OceanBase 4.3.3版本升级了对 复杂数据类型 处理能力。
新增Array类型,这意味着数据库可以直接存储、查询和操作数组数据。并对Roaringbitmap类型数据的计算性能进行了优化,意味着数据库能够更高效地处理和操作大型集合数据。
其次,OceanBase 4.3.3在向量融合查询的关键能力上带来提升, 推出全新向量检索能力 ,支持向量数据类型和向量索引,并基于向量索引提供强大搜索能力。
用户可通过SQL及Python SDK等方式灵活调用OceanBase的向量检索能力。
如今,在通用数据库中集成向量插件已经成为一种趋势,这种方式能够直接复用通用数据已有功能和生态。
OceanBase与蚂蚁集团联合开发了向量索引库,这个索引库已经在蚂蚁集团大量业务场景中得到验证(如生物识别、企业内部知识库等),性能成熟。
现场跑分结果显示,该向量库在960维的GIST数据集上表现出色,在ANN Benmarks测试中性能远超其他算法, 排名第一 。
特别是在 90% 以上的召回率区间,查询性能(QPS)相比此前最优算法 glass 提升 100%,相比基线算法hnswlib提升300%。
该向量引擎深度融合了OceanBase的存储引擎和SQL引擎,实现 SQL+AI一体化 。能够在一条SQL语句中实现标量、向量、空间地理等混合查询。
比如“望小京”demo中,用户给的提示词为“推荐两公里内、评分4.5以上、人均消费25元以内干净卫生的奶茶店”。这背后涉及到处理文本、图像和地理位置等不同类型的数据,需要更强大的数据分析和查询能力。
最后,OceanBase 4.3.3还针对AP(分析处理)场景进行大幅性能优化,尤其是在海量数据分析时,能够提供更短的响应时间和更高的吞吐能力。
同时大幅完善了 实时AP功能 ,包括支持列存副本、物化视图、外表集成、快速导入导出等。
实现满足TP和AP负载的物理资源强隔离,可确保系统在处理事务型负载时,不受分析型负载的影响,特别是在实时数据分析和决策场景中,能够保持系统的高性能与稳定性。
在易用性方面也做了升级,通过提供AP参数版本,用户可以针对不同场景选择特定模板,不需要再单独配置参数。并增强了AP场景中对SQL诊断能力的支持。
总结来看,OceanBase 4.3.3在基础分布式能力上,带来更强性能、向量多模融合、融入AI技术栈。
也就是将AI与数据库进一步融合。
这并不难理解,AI应用/AI Agent大势所在,各类应用智能化升级改造,底层数据库必须紧随趋势升级。
不过在这之中,OceanBase还反复提到了一个关键词—— 一体化 。
它不仅是OceanBase的自身特性,如今也逐渐成为行业拥抱AI时代的一个优解。
更快推动AI应用大规模落地
对于数据库的发展,行业内逐渐达成一些共识。
AI能力大幅提升,导致全球80%以上的非结构化数据被激活,背后的挖掘分析需求井喷,在这一新变化下,数据处理面临更大规模、更多模态、实时性更强以及数据碎片和数据孤岛问题。
这些变化给数据库提出了诸多新的发展需求。
最首要的便是, 分布式数据库 成为一种大趋势。
华东师范大学数据学院院长、CCF数据库专委会常委钱卫宁提出,互联网时代数据走向了 开放环境 ,在数据是分布式的时代里,数据库也需要是分布式的。
分布式数据库 可以让多台服务器协同作业,完成单台服务器无法处理的任务,尤其是高并发或者大数据量的任务。
除此之外,随着AI、云计算等技术发展,数据库还呈现出以下特点。
第一,云计算的普及推动了 云数据库的快速发展 。云数据库提供按需扩展、高可用性和成本效益。
第二,大数据和非结构化数据需求增加, 多模态 是一种趋势,NoSQL数据库(如MongoDB、Cassandra、Redis、Couchbase)越来越受到欢迎。NoSQL数据库提供了更好的扩展性和灵活性,适用于存储和处理各种数据类型,如文档、键值对、图数据等。
第三, HTAP数据库成为热点 ,甚至是主流数据库的一项基础能力。这类数据库能够同时处理事务性和分析性工作负载,满足了企业实时数据处理和分析的需求。
第四, 开源也是一大趋势 。开源数据库(如PostgreSQL、MySQL、MariaDB)凭借其社区驱动的发展模式、强大的功能和灵活的部署方式,成为企业和开发者的热门选择。
不过来到实际落地层面,尽管数据、数据库在变得更加多元复杂,但是企业用户总还是希望能 只用一套系统来解决不同工作负载 。
比如能同时在事务处理(如支付、订单等高频交易场景)和复杂的实时分析查询,这背后需要TP+AP结合。
以及AI与多模查询能力的融合,如Rockset和Oracle这样的数据库系统通过hybrid search融合查询技术,将SQL查询与向量化查询相结合,使得数据处理能够同时包含文本、结构化数据和向量数据等不同类型。
方方面面影响下, 一体化设计 逐渐成为被市场青睐的路线。
以MongoDB和Oracle为代表的数据库厂商正在各自推动一体化数据库的发展。国家工业信息安全发展研究中心等共同编制的《分布式数据库发展趋势研究报告》中也表示, 分布式数据架构的设计正在走向一体化 。
在这之中,OceanBase的一体化理念非常鲜明。它包括:
OceanBase介绍,这种一体化的思路是随着客户需求不断发展而来。
首先在底层架构设计上,单机分布式一体化与多云原生并存,可以满足大中小企业的不同需求。OceanBase已经和目前主流云厂商均达成合作,实现公有云“多云共生”,同时也提供专有云、混合云等不同部署环境,保证一致体验。
其次随着数据库场景不断变化,从传统场景到泛互联网场景,OceanBase从TP到TP+AP,逐渐走向多工作负载一体化。
比如在第一阶段OLTP+,会浮现出山东移动这类客户的需求,他们主要关注复杂查询场景,需要增强业务处理效率。
第二阶段浮现出了海底捞这类用户的需求。海底捞本来使用两个系统分别处理OLTP和OLAP,这导致OLTP和OLAP之间存在数据延迟,没法保证数据一致性,还需要两份数据两份成本。OceanBase能将其整合,不仅使整体成本降低,还能提升原本的AP性能。
第三阶段还会浮现出实时营销等场景,对实时AP提出更多要求。
以及在实际推广中,OceanBase发现越来越多客户将OceanBase既应用在KV存储场景,也应用在NoSQL场景,或者替换HBase、Redis等。因为OceanBase能够解决各个场景中很多棘手问题,比如对于NoSQL而言,最大的挑战在于数据规模,分布式架构可以很好解决数据扩展的问题。
因此,顺应用户需求,OceanBase在不断增加对多种数据类型的支持,实现多模一体化。
最后,来到AI时代。“AI for DB,DB for AI”成为共识。
AI应用大规模落地的前提是大模型技术能够在各行各业低成本易用。
数据库的发展经验可以为AI应用推广提供参考。比如在数据库中引入向量插件,实现SQL+AI,能够大幅简化原有AI技术栈,让打造AI Agent的门槛骤降。
最后总结来看,以OceanBase为代表的一体化数据库不仅能为企业提供更更好的数据底座,而且方方面面都满足AI应用发展的需求。它总体呈现出这些特点:
第一,高效的数据处理和分析 。
支持HTAP,能够在同一个系统中同时处理事务性(OLTP)和分析性(OLAP)负载。企业可以实时地对交易数据进行分析,而不需要等待数据的同步和转移,从而加快决策速度和响应时间。
实时分析,可以在数据生成的同时进行分析,确保数据的时效性,这对于实时推荐、风控、监控等AI应用至关重要。
第二,简化的数据管理 。
一体化数据库能够确保数据的一致性和完整性,因为事务处理和分析处理在同一个系统内完成,避免了数据同步和转换过程中可能出现的延迟和错误。
通过将多种数据类型(如关系型数据、文档数据、向量数据等)集成在一个系统中,一体化数据库简化了数据存储和管理。企业不需要维护多个数据库系统,减少了数据孤岛问题和运维复杂性。
第三,灵活性和扩展性 。
一体化数据库支持多模态数据处理,能够处理和分析结构化、半结构化和非结构化数据。这种灵活性使企业可以在一个平台上处理不同类型的数据,满足各种业务需求。
一体化数据库可以在公有云、私有云和本地数据中心的混合环境中部署,支持异构环境下的数据管理和应用。这使企业能够根据业务需求灵活选择和调整部署方案。
第四,简化AI应用构建 。
AI应用通常需要进行高效的向量检索和相似性搜索。一体化数据库通过深度集成向量引擎,支持快速向量化计算和相似度查询,提升AI应用的性能。
一体化数据库能够将数据存储和AI模型紧密结合,支持复杂的AI工作负载。这种集成减少了数据传输的延迟,提高了模型训练和推理的效率。
第五,降低成本和复杂性 。
一体化数据库减少了企业需要维护的数据库系统数量,简化了技术栈,降低了系统集成和运维的复杂性。
通过优化资源利用和减少多系统间的数据同步和转换,一体化数据库降低了总体拥有成本,提高了投资回报率。
AI时代,Data is Power 。
李飞飞当初笃定做ImageNet,背后的核心逻辑就在于,她相信AI改变世界,数据是最简单最直接的方式。
如今,AI应用落地趋势已经开启。数据作为生产要素,在AI时代已是水电般的存在。
而一体化数据库正在为数据更充分灵活高效应用提供新思路。
据了解,一体化数据库OceanBase将成为蚂蚁集团的AI数据底座,为一系列AI时代新应用“支小宝”、“蚂小财”以及支付宝百宝箱智能体开发平台的数据管理提供支持。
一体化正在成为数据库发展历程中,一个旗帜鲜明的方向。
PhiData 一款开发AI搜索、agents智能体和工作流应用的AI框架
PhiData构建具有长期记忆、丰富知识和强大工具的AI助手是一项具有挑战性的任务。 PhiData作为一款开源框架,旨在为开发者提供便利,帮助其构建具备这些特性的智能助手。 设计上,一个助理通过语言模型(LLM)、长期记忆、结构化与非结构化知识以及各种工具(如搜索引擎与API调用)协同工作。 使用PhiData极为简便,仅需简单的步骤。 举例如下:创建助手脚本,安装依赖库并配置API密钥,就能启动助理运行。 官方提供了示例,包括搜索助理等应用,展示了如何轻松构建具有实用功能的助手。 PhiData还支持开发agent与工作流应用。 用户可在交互界面内选择不同工具与助手,灵活调配资源以满袜则足特定需求,从财报分析到新闻检索,都能快速响应。 通过代码实现复杂工作流,串联不同助理与工具,解决复杂问题变得轻而易举,例如,构建从获取HackerNews排行榜到生成文章的流程。 冲卜总结来说,PhiData以其多功能集成与高效部署特性,提供了构建AI产品的新视角。 无论是开告判棚发智能助手、智能代理还是工作流应用,它都能为开发者提供强大的支持。 项目链接/phidatahq/ph...
大模型商业化前夜:企业需要知道这四类AI Agent智能助理
大模型商业化时代的智能转型:企业必看的AI Agent四大角色
在企业迈向数字化转型的道路上,大模型正逐渐成为关键的基础设施,其潜力在于提升效率、拓宽业务边界和优化用户体验。 然而,如何在尚未实现大规模商业爆发的当下,明智地选择和利用AI Agent,是每个企业家面临的重要挑战。 本文将深入探讨四种类型的智能助手,帮助企业在AI浪潮中占据先机。
数据驱动的智能助手:Data Agent
数据是企业的生命线,Data Agent作为关键工具,通过自然语言处理将商业洞察需求转化为数据驱动的行动。 它能调用API、访问数据库,甚至编写分析代码,为企业提供实时的数据分析和可视化服务。 但务必注意,这需要高度依赖大模型的自然语言转数据能力,如SQL或Python代码,尽管有优化模型和提示工程,仍存在一定的技术挑战。
办公自动化助手:办公类智能助理
这类智能助理聚焦于日常办公任务的自动化,通过自然语言交互提供知识检索、任务执行等服务,无缝融入员工的工作流程。 它们通过调用第三方接口,实现与企业应用的高效集成,国内团队已经开发出RPA技术,能避免直接调用API,提高工作效率。
创新创作助手:生成类智能助理
生成类智能助理是大模型应用的精华,擅长于内容生成,如写作、设计、编程等,能够助力企业内部创作,甚至构建个性化的个人AI助理。 这些工具通过API集成,显著提升内容生成的效率和质量。
智能营销的新触角:营销类智能助理
营销领域是AI Agent的早期蔽谨岩落地领域,AI Agent已能在对话自动化、精准营销中大显身手。 从产品推荐到客户服务,AI Agent正在重塑企业的营销策略,如Alexa、Intelligent Portfolio和聊天机器人。 宏御
展望2024,AI Agent将更加深入企业内部,助力企业实现工作流程的优化升级。 通过智能助手,企业不仅能提升员工的生产力,还能实现工作量的实质性增长,从而驱动企业的整体增长。 在这个AI元年,明智地选择和运用AI Agent,将成为晌缺企业成功的关键一步。
AI Agent深度调研:如何设计一个QQ机器人
当大语言模型风靡之际,AI Agent这一概念引起了广泛关注。 本文将深入解析AI Agent的定义、与LLM的关系、应用场景,以及技术难点和现状,最后以设计一个QQ机器人为例进行说明。 AI Agent,即智能体,它的发展经历了漫长过程,从古希腊哲学家的思考到现代AI的落地,包括规则基础系统、知识系统等阶段,直至深度学习和强化学习的兴起,以及大语言模型的介入。 例如,AI斯坦福小镇展示了基于LLM的AI Agent在虚拟环境中的互动与自我进化。 AI Agent的核心在于其四要素:大语言模型(LLM)、记忆能力、规划能力以及工具使用能力。 记忆模块帮助存储和检索信息,规划能力则驱动目标导向任务的执行,而工具使用能力则允许智能体利用外部资源。 例雹空如,RAG技术结合大模型和检索,提高了回答的准确性和时效性。 技术难点包括多模态理解、安全性和伦理隐私,但随着技术的橘唤发展,如LangChain框架、向量数据库等,这些问题正在得到解决。 大语言模型如GPT系列和国内的OpenAI、Google等公司产品,都在AI Agent领域有所突破。 设计QQ机器人时,关键在于实现智能体的自然语言理解和生成能力,以及与用户个性化交互。 QQ机圆肆凯器人开放平台提供了丰富的接口,允许开发者构建具有记忆、规划和执行功能的AI Agent,如鹅探长机器人展示了在群聊中的应用潜力。 AI Agent的发展不仅关乎技术进步,也与人类对智能理解的深入探讨有关。 虽然无法确定何时能实现AGI,但统一而强大的架构如Transformer被认为是潜在的方向。 未来,AI Agent将在更多领域展现出其潜力,带来生活的便利和可能性的扩展。 要了解更多关于AI Agent的详细信息,可参考以下扩展阅读和参考资料。