youxihw下载站:汇聚最热门软件,安全、高速、放心的专业下载站!

您现在的位置:首页 > > 资讯教程 > 文章列表

总数:6243/15 1 2 3 4 5 6 416 417

推荐文章

  • Swiggy发布HermesV3:实现从文本到SQL再到对话式AI的演进

    Swiggy推出了Hermes V3,这是一款基于生成式AI技术打造的文本转SQL助手。借助该助手,员工可以通过简单的英语来查询数据。Hermes在Slack平台上运行,它融合了向量检索、会话记忆、代理编排以及解释层等功能,从而能根据自然语言输入生成精准的SQL查询语句。 Swiggy是印度的一家在线食品订购与配送企业,其最初推出的Hermes是一个轻量级接口,员工可通过它提出简单问题,系统会针对内部数据存储执行相应SQL查询并反馈结果。不过早期版本存在一些不足:在派生指标上有局限,缺少对话上下文,对相似提示的响应结果不一致,而且没有明确的方式验证生成的SQL。为解决这些问题,工程团队借助少样本学习、元数据检索以及围绕大型语言模型构建的结构化工作流,对系统进行了重新搭建。 之前的Hermes整体架构(来源:Swiggy技术博客) 在第三次迭代过程中,Hermes采用了一套依托向量技术的提示检索系统,该系统的运行基础是历史SQL在Snowflake里的执行情况。考虑到大部分生产查询都缺少具有描述性的元数据,团队借助具备大上下文处理能力的语言模型,把SQL查询转化为自然语言解释,从而成功弥补了查询意图缺失的问题。这些生成出来的提示会通过向量相似性完成索引工作,并且作为少样本示例被注入系统,这样一来,Hermes就能在过往的分析模式中为新请求找到依据,进而大幅提升SQL生成的精准度。 正如Swiggy的工程师Meghana Negi与Rutvik Reddy所着重指出的: Hermes目前借助一个精心构建的、包含过往已执行查询及其提示信息的数据库,通过向量相似性检索方式,并结合对对话上下文的记忆,不仅把SQL生成的准确率从54%提升至93%,还达成了自然流畅的多轮交互效果。 Hermes V3工作流(来源:Swiggy技术博客) Hermes V3具备对话记忆功能,支持多轮查询时直接引用过往交流内容,无需重复上下文信息。得益于系统对会话状态的实时跟踪,能将简单指令延伸为复合性请求,用户交互过程自然顺畅。系统内置的编排代理采用ReAct模式的推理循环机制,可将复杂问题拆解为可复用工作流中的一系列独立任务,具体包括:意图解析、完整性校验、元数据查询、示例调取、中间逻辑搭建、SQL语句生成以及必要时的信息澄清请求。 用于查询生成代理流的结构化智能(来源:Swiggy技术博客) 另一个突出的改进是增设了一层解释机制,它会阐明生成SQL语句时所依据的假设,并为其赋予置信度评分。这种透明化的设计让非技术背景的利益相关者能够清楚查询的构建逻辑,进而提升对机器生成洞见的信任感。 Hermes V3系统和Swiggy的安全、合规及元数据基础设施实现了深度整合。借助基于角色的访问控制、单点登录、临时响应与审计日志等机制,可保障敏感数据的访问行为符合内部治理规范。而混合式元数据检索策略,能够高效获取相关的模式、表及列的详细信息,在将令牌使用量控制在LLM服务限制范围内的同时,也能维持良好的性能表现。 Hermes的架构整合了多种开源技术与云原生技术。其检索功能依托向量数据库和嵌入模型来实现;编排逻辑则借助LangChain等工具构建结构化的提示工作流;可观察性框架通过分层设计,达成了来源追溯与监控的目标。而Snowflake用于数据分析,PostgreSQL或同类事务性数据库,还有API网关,均属于支撑Hermes功能的更广泛生态系统的构成部分。
  • 荣耀Power2下周登场!首发配备10080mAh超大容量电池
  • ModelX与大货车相撞致一家四口不幸身亡家属因辅助驾驶功能缺陷起诉特斯拉
  • 疑似国内又涌入大量RTX5090显卡!国外玩家都羡慕得不行了
  • 高通骁龙8E6率先采用2nm工艺,苹果A20迎来最强劲对手
  • 安卓旗舰机型将率先搭载LPDDR6内存:仅提供16GB版本售价或再度上调