Optimisation des Index Vectoriels

VérifiéSûr

Aide à optimiser les performances des index vectoriels en ajustant les paramètres HNSW, en sélectionnant des stratégies de quantification et en gérant l'équilibre entre latence, rappel et mémoire. Utile lors du passage à l'échelle de l'infrastructure de recherche vectorielle ou pour réduire la latence des requêtes tout en maintenant la qualité des résultats.

Spar Skills Guide Bot
Data & IAIntermédiaire
3002/06/2026
Claude CodeCursor
#vector-index#hnsw#quantization#performance-tuning#search

Recommandé pour

Notre avis

Ce guide aide à optimiser les paramètres d'un index vectoriel (par exemple HNSW, quantification) pour équilibrer latence, rappel et utilisation mémoire en production.

Points forts

  • Propose des étapes concrètes de benchmarking et de validation
  • Couvre le balayage de paramètres pour HNSW et les techniques de quantification
  • Inclut des consignes de sécurité et de rollback pour les modifications en production

Limites

  • Suppose une familiarité de base avec les concepts de recherche vectorielle
  • Ne couvre pas la conception complète d'un système de retrieval au-delà du réglage d'index
  • Nécessite des métriques de charge et des données de vérité terrain pour valider le rappel
Quand l'utiliser

Utilisez-le lorsque vous devez régler les paramètres HNSW, mettre en œuvre la quantification ou passer à l'échelle avec des milliards de vecteurs tout en respectant des objectifs stricts de latence et de rappel.

Quand l'éviter

Ne l'utilisez pas si vous avez besoin uniquement d'une recherche exacte sur de petits jeux de données (préférez un index plat) ou si vous manquez de métriques de charge pour valider le rappel.

Analyse de sécurité

Sûr
Score qualité85/100

The skill is a knowledge resource on tuning vector indexes, containing no executable instructions or dangerous operations. It advises caution but does not perform any actions.

Aucun point d'attention détecté

Exemples

Tune HNSW parameters
I need to tune HNSW parameters (efConstruction, M, efSearch) for a 10M vector dataset with 768-dimensional embeddings. Target: 95% recall at <50ms latency and 10GB memory budget. Help me run a parameter sweep and interpret results.
Select quantization strategy
My vector index uses 1M 512-dimensional float vectors but memory is too high. Which quantization method (e.g., PQ, SQ, binary) should I choose to reduce memory by 4x while keeping recall above 90%? Provide a benchmarking plan.
Scale index to billions
We're scaling our vector search to 1B vectors with HNSW. How should I shard the index across multiple nodes and tune efConstruction/efSearch to maintain sub-100ms latency? Include memory estimates and cost considerations.

name: vector-index-tuning description: "Optimize vector index performance for latency, recall, and memory. Use when tuning HNSW parameters, selecting quantization strategies, or scaling vector search infrastructure." metadata: author: ncdevshiv version: "1.0" category: other updated: 2026-02-25 risk: unknown source: community

Vector Index Tuning

Guide to optimizing vector indexes for production performance.

Use this skill when

  • Tuning HNSW parameters
  • Implementing quantization
  • Optimizing memory usage
  • Reducing search latency
  • Balancing recall vs speed
  • Scaling to billions of vectors

Do not use this skill when

  • You only need exact search on small datasets (use a flat index)
  • You lack workload metrics or ground truth to validate recall
  • You need end-to-end retrieval system design beyond index tuning

Instructions

  1. Gather workload targets (latency, recall, QPS), data size, and memory budget.
  2. Choose an index type and establish a baseline with default parameters.
  3. Benchmark parameter sweeps using real queries and track recall, latency, and memory.
  4. Validate changes on a staging dataset before rolling out to production.

Refer to resources/implementation-playbook.md for detailed patterns, checklists, and templates.

Safety

  • Avoid reindexing in production without a rollback plan.
  • Validate changes under realistic load before applying globally.
  • Track recall regressions and revert if quality drops.

Resources

  • resources/implementation-playbook.md for detailed patterns, checklists, and templates.
Skills similaires