Cuando se une a columnas de tabla, ya no es necesario y la coincidencia exacta. La coincidencia difusa le permite comparar elementos de listas independientes y unirse a ellos si están cerca entre sí. Incluso puede establecer la tolerancia correspondiente o umbral de similitud.
Un caso de uso común para la coincidencia difusa es con campos de texto de forma libre, como en una encuesta en la que la pregunta de su fruta favorita podría tener errores tipográficos, singulares, plurales, mayúsculas, minúsculas y otras variantes que no coincidan exactamente.
La coincidencia aproximada solo es compatible con las operaciones de combinación sobre columnas de texto. Power Query usa el algoritmo de similitud jaccard para medir la similitud entre pares de instancias.
Procedimiento
-
Para abrir una consulta, busque una cargada previamente desde el Editor de Power Query, seleccione una celda de los datos y, a continuación, seleccione Consulta > Editar. Para obtener más información, vea Crear, editar y cargaruna consulta en Excel (Power Query).
-
Seleccione Inicio > Combinar > combinar consultas. También puede seleccionar Combinar consultas como Nuevo. Aparecerá el cuadro de diálogo Combinar con la tabla principal en la parte superior.
-
Seleccione la columna que desea usar para la coincidencia aproximada. En este ejemplo, seleccionamos Nombre.
-
En la lista desplegable, seleccione la tabla secundaria y, a continuación, seleccione la columna de coincidencia aproximada correspondiente. En este ejemplo, seleccionamos Nombre.
-
Seleccione un tipo de combinación. Hay varias formas diferentes de unirse. Externo izquierdo es el valor predeterminado y el más común. Para obtener más información sobre cada tipo de combinación, vea Combinar consultas.
-
Seleccione Usar coincidencia difusa para realizar lacombinación, seleccione Opciones decoincidencia difusas y, a continuación, seleccione una de las siguientes opciones:
-
Umbral de similitud Indica cómo deben ser dos valores similares para poder coincidir. El valor mínimo de 0,00 hace que todos los valores coincidan entre sí. El valor máximo de 1,00 solo permite coincidencias exactas. El valor predeterminado es 0,80.
-
Omitir mayúsculas y minúsculas Indica si los valores de texto deben compararse de una manera que distingue mayúsculas de minúsculas o no. El comportamiento predeterminado no tiene mayúsculas de minúsculas, lo que significa que se omite mayúsculas de minúsculas.
-
Número máximo de coincidencias Controla el número máximo de filas coincidentes que se devolverán para cada fila de entrada. Por ejemplo, si solo desea buscar una fila que coincida con cada fila de entrada, especifique un valor de 1. El comportamiento predeterminado es devolver todas las coincidencias.
-
Tabla de transformación Especifique otra consulta que contiene una tabla de asignación para que algunos valores se puedan asignar automáticamente como parte de la lógica de coincidencia. Por ejemplo, definir una tabla de dos columnas con columnas de texto "De" y "A" con los valores "Microsoft" y "MSFT" hará que estos dos valores se consideren iguales (puntuación de similitud de 1,00).
-
-
Power Query analiza ambas tablas y muestra un mensaje sobre cuántas coincidencias realizó. En el ejemplo, la selección coincide con 3 de 4 filas de la primera tabla. Sin usar coincidencias aproximadas, solo 2 de las 4 filas coincidirían.
-
Si está satisfecho, seleccione Aceptar. Si no es así, pruebe diferentes opciones de combinación de difusas para personalizar su experiencia.
-
Cuando esté satisfecho, seleccione Aceptar.
Vea también
Ayuda de Power Query para Excel