Cuando un usuario escribe una pregunta en StackOverflow, el sistema debería detectar si ya existe una pregunta similar para evitar duplicados.
Cuando un usuario escribe una pregunta en StackOverflow, el sistema debería detectar si ya existe una pregunta similar para evitar duplicados. La búsqueda por palabras clave falla cuando dos preguntas usan vocabulario diferente pero significan lo mismo — se necesita similitud semántica.
Sistema de búsqueda de preguntas similares con word embeddings: Word2Vec de Google (preentrenado) y SentenceTransformers para sentence embeddings. El sistema representa cada pregunta como un vector denso y encuentra las más similares por distancia coseno.