Optimisation des Index Vectoriels

VérifiéSûr

Guide pour optimiser les performances des index vectoriels en termes de latence, rappel et mémoire. Utile lors du réglage des paramètres HNSW, du choix de stratégies de quantification ou de la mise à l'échelle de l'infrastructure de recherche vectorielle.

Spar Skills Guide Bot
Data & IAIntermédiaire
9002/06/2026
Claude Code
#vector-index#hnsw#quantization#search-latency#recall-tuning

Recommandé pour

Notre avis

Ce guide optimise les performances des index vectoriels (HNSW, quantification) pour la latence, le rappel et la mémoire.

Points forts

  • Approche structurée avec paramétrage systématique
  • Couverture des aspects clés (HNSW, quantification, mémoire)
  • Recommandations de sécurité pour la production
  • Référence à une playbook d'implémentation détaillée

Limites

  • Nécessite des métriques de charge réelles ou un ensemble de validation
  • Ne traite pas la conception complète du système de recherche
  • Se concentre sur les index vectoriels, pas sur d'autres méthodes de recherche
Quand l'utiliser

Quand vous devez ajuster les paramètres HNSW, implémenter la quantification ou équilibrer rappel et vitesse pour des millions ou milliards de vecteurs.

Quand l'éviter

Pour une recherche exacte sur de petits jeux de données où un index plat suffit, ou si vous manquez de données de validation pour mesurer le rappel.

Analyse de sécurité

Sûr
Score qualité88/100

The skill is purely advisory guidance for vector index tuning; it contains no executable commands, no external data access, and no instructions that could harm systems or exfiltrate data.

Aucun point d'attention détecté

Exemples

HNSW parameter sweep
I need to tune HNSW parameters (M, ef_construction, ef_search) for a 10M vector dataset. Help me design a benchmark to balance recall and latency.
Quantization strategy selection
Which quantization method should I use for my 768-dimension embeddings to reduce memory usage while maintaining 95% recall? I have 100M vectors.
Production rollback plan
I want to reindex my vector collection with new HNSW parameters in production. Provide a safe rollback plan and validation steps to avoid quality regressions.

name: vector-index-tuning description: "Optimize vector index performance for latency, recall, and memory. Use when tuning HNSW parameters, selecting quantization strategies, or scaling vector search infrastructure." risk: unknown source: community date_added: "2026-02-27"

Vector Index Tuning

Guide to optimizing vector indexes for production performance.

Use this skill when

  • Tuning HNSW parameters
  • Implementing quantization
  • Optimizing memory usage
  • Reducing search latency
  • Balancing recall vs speed
  • Scaling to billions of vectors

Do not use this skill when

  • You only need exact search on small datasets (use a flat index)
  • You lack workload metrics or ground truth to validate recall
  • You need end-to-end retrieval system design beyond index tuning

Instructions

  1. Gather workload targets (latency, recall, QPS), data size, and memory budget.
  2. Choose an index type and establish a baseline with default parameters.
  3. Benchmark parameter sweeps using real queries and track recall, latency, and memory.
  4. Validate changes on a staging dataset before rolling out to production.

Refer to resources/implementation-playbook.md for detailed patterns, checklists, and templates.

Safety

  • Avoid reindexing in production without a rollback plan.
  • Validate changes under realistic load before applying globally.
  • Track recall regressions and revert if quality drops.

Resources

  • resources/implementation-playbook.md for detailed patterns, checklists, and templates.
Skills similaires