当前位置: 首页 > news >正文

cod建站平台广告联盟哪个比较好

cod建站平台,广告联盟哪个比较好,东莞做一个企业网站要多少钱,百度云安装wordpress以往 OpenSearch 摄入时的一些最佳实践中并不包含 knn 的情况#xff0c;所以在 knn 索引存在的情况#xff0c;不能完全参照之前的结论#xff0c;通过以上三种不同的实验方式#xff0c;在多次实验的过程中#xff0c;本文得到了以下的一些实践经验和结论#xff0c;供…以往 OpenSearch 摄入时的一些最佳实践中并不包含 knn 的情况所以在 knn 索引存在的情况不能完全参照之前的结论通过以上三种不同的实验方式在多次实验的过程中本文得到了以下的一些实践经验和结论供参考 a. CPU 利用率和参数 ef_construction 与 m 明显正相关在实验中使用较大的 ef_construction 和 m 时CPU 很容易达到 100%。实验中在其他参数相同的情况下ef_construction 为 512 时CPU 利用率会长期保持在 100%改为 2 时利用率基本在 20% 以下峰值不超过 30%。 b. 客户端并行数量与 OpenSearch 的摄入速度和负载成正相关但并不是线性相关。多客户端能提高摄入速度但是客户端数量过多可能会导致大量的(429, ‘429 Too Many Requests /_bulk’)和(503, “No server available to handle the request..”)等错误。 c. 指数退避重试机制能保证摄入的完整性以及因集群瞬时不可用导致的大面积写入失败opensearch-py包中有如下摄入函数, 如果并发客户端过多可能会导致CPU利用率一直位于100%在max_retries的重试次数内每次会等待 initial_backoff * (attampt_idx ** 2)的时间通过设定一个较大的initial_backoff等待时间能避免在客户端并发数偏大的情况下出现大面积429错误。另外客户端数也不能过大否则也会更容易出现大量的503相关错误。对于偶发的503报错可以利用 glue 的 retry 机制处理保证写入的完整性。 注意在大规模向量数据库数据摄入的生产场景中不建议使用LangChain提供的向量数据库接口查看其源码可知LangChain的默认实现是单客户端且其内部实现没有使用指数退避Retry机制无法保证摄入速度和完整性。 d. 写入完成后建议查询文档的去重数量确保写入的完整性。可以在 OpenSearch Dashboard 的 Dev tools 中使用如下的 DSL 语句查询文档总数。注意 cardinality 方式的统计不是精准统计值可以提高 precision_threshold 参数值来提高其准确性。 同时可以按照文档名统计对应的 chunk 数量可以帮助发现潜在文档处理向量数据库质量问题参考下面代码 e. refresh_interval 设置为 -1在其他相关参数的相同的情况下503 报错明显增加。更改为 60s 后情况有明显好转, 如果发生类似问题可以做类似的调整。 04 检索性能调优 数据注入完毕以后直接查询性能是十分差的查询时延可能在几秒甚至十几秒。需要进行一些必要的优化。核心的主要有两点 a. Segment 合并 Segment 是 OpenSearch 中的最小搜索单元。如果每个 shard 只有 1 个 segment搜索效率将达到最高。为了实现这个目标我们可以通过控制 refresh interval 来降低小 segment 的生成速度或者手动进行 segment merge。这将有助于减少搜索过程中的开销提高搜索速度。 可以在 OpenSearch Dashboard 的 Dev tools 中通过如下的 DSL 执行合并整个合并过程比较长执行之前可以调高用于合并的线程最大值能够提高向量数据库合并的速度。 合并前后可以执行如下 DSL 来检查当前的 segments 情况 GET _cat/segments/{index_name}?vhindex,segment,shard,docs.count,docs.deleted,size 以下表格是合并 segments 后的情况合并完成后每个 shard 下仅有一个 segment数据也均匀分布标记删除的向量数据库数据也被清理掉了。 b. k-NN 索引 warmup 由于向量数据库 k-NN 索引的性能与索引数据结构是否缓存到内存中密切相关能够提供的缓存内容容量对性能影响很大。可以执行以下 DSL 命令对 k-NN 索引进行预热 GET /_plugins/_knn/warmup/{index_name}?pretty 预热执行很快预热完毕以后性能会有明显改善。可以到 CloudWatch 中去查看 OpenSearch Domain 中的 KNNGraphMemoryUsagePercentage 指标进行确认是否执行完毕如图所示 本文在本系列上篇博客的基础上通过一个真实数据场景的实践进行更详细的阐述讨论的重点更多放在针对大规模的文档、更快更完整地构建基于向量数据库的知识库上面这对于一些行业如金融、法律、医疗等行业向量数据库的知识库的构建具备指导借鉴意义。 本文的第一部分对于 Amazon OpenSearch 向量数据库的集群配置选择给出了一些方法参考第二三四部分对于数据摄入和检索性能等方面给出了一些初步的经验总结。
http://www.lebaoying.cn/news/25932.html

相关文章:

  • 厦门旋挖建筑公司网站做化学科普网站的目的
  • 群晖可以做网站服务器南京seo招聘
  • 网站制作模板教案自己建个购物网站
  • 怎么做网站文章伪原创2023全民核酸又开始了
  • 网站云优化营销推广策略
  • wordpress企业建站wordpress网站logo没显示
  • 网站的虚拟主机到期创建网站花钱吗
  • 惠州住房和城乡建设部网站郑州淘宝网站建设
  • 盐城整站优化网页的制作软件
  • 福州网站建设推广建站公司还有前途吗
  • 做音箱木工网站游戏 网站模板
  • 化妆品企业网站建设的缺点营销网站规划的要点包括( )
  • 合肥在线网站免费云服务器官网
  • asp科技公司网站源码化工网站关键词优化
  • 企业的网站建设策划书大型游戏网页游戏大全
  • 网络公司 网站设计wordpress 代码生成器
  • 企业优化网站中国大基建最新消息
  • 揭阳网站制作计划扬州商城网站制作
  • 如何建设互联网政务门户网站广东省东莞市建设培训中心网站
  • 免费企业网站建设站牛网
  • 美丽乡村 村级网站建设网站建设及网络维护合同
  • 海外搜索引擎网站建设免费无代码开发平台本地部署
  • 企石网站建设公司专做it招聘的网站
  • 国内好的设计网站怎么破解网站后台密码
  • 旅游网站开发参考文献企腾做的网站怎么样
  • 网站html地图导航代码大全市场监督管理局电话号码
  • 网站建设教程培训企业服务局
  • 网页设计自学视频网站遵义本地网站
  • 做美食类网站现状c2c网站建设系统
  • 若要使用链接目标在新窗口打开seo单页面wordpress