Quando si uniscono le colonne della tabella, non è più necessario e la corrispondenza esatta. La corrispondenza fuzzy consente di confrontare gli elementi in elenchi separati e unirli se sono vicini tra loro. È anche possibile impostare la tolleranza di corrispondenza o soglia di similarità.
Un caso d'uso comune per la corrispondenza fuzzy riguarda i campi di testo a mano libera, ad esempio in un sondaggio in cui la domanda del frutto preferito potrebbe contenere errori di digitazione, singolari, plurali, maiuscole, minuscole e altre varianti che non corrispondono esattamente.
La corrispondenza fuzzy è supportata solo nelle operazioni di unione su colonne di testo. Power Query usa l'algoritmo di similarità di Jaccard per misurare la similarità tra coppie di istanze.
Procedura
-
Per aprire una query, individuarne una precedentemente caricata dall'editor di Power Query, selezionare una cella nei dati e quindi selezionare> Modifica. Per altre informazioni, vedere Creare, modificare e caricare una query in Excel (Power Query).
-
Selezionare Home > Combina >unisci query. È anche possibile selezionare Unisci query come nuovo. Viene visualizzata la finestra di dialogo Unisci con la tabella principale nella parte superiore.
-
Selezionare la colonna da usare per la corrispondenza fuzzy. In questo esempio si seleziona Nome.
-
Nell'elenco a discesa selezionare la tabella secondaria e quindi selezionare la colonna corrispondente della corrispondenza fuzzy. In questo esempio si seleziona Nome.
-
Selezionare un tipo di join. Esistono diversi modi per partecipare. Left Outer è l'impostazione predefinita e la più comune. Per altre informazioni su ogni tipo di join, vedere Unire query.
-
Selezionare Usa corrispondenza fuzzy per eseguire l'unione,selezionare Opzioni di corrispondenza fuzzye quindi selezionare una delle opzioni seguenti:
-
Soglia di similarità Indica quanto devono essere simili due valori per poter trovare una corrispondenza. Il valore minimo di 0,00 fa sì che tutti i valori corrispondano tra loro. Il valore massimo di 1,00 consente solo corrispondenze esatte. Il valore predefinito è 0,80.
-
Ignora maiuscole/minuscole Indica se i valori di testo devono essere confrontati con distinzione tra maiuscole e minuscole o senza distinzione tra maiuscole e minuscole. Il comportamento predefinito non fa distinzione tra maiuscole e minuscole, pertanto la distinzione tra maiuscole e minuscole viene ignorata.
-
Numero massimo di corrispondenze Controlla il numero massimo di righe corrispondenti che verranno restituite per ogni riga di input. Ad esempio, se si vuole trovare una sola riga corrispondente per ogni riga di input, specificare il valore 1. Il comportamento predefinito è restituire tutte le corrispondenze.
-
Tabella di trasformazione Specificare un'altra query che contiene una tabella di mapping, in modo che alcuni valori possano essere mappati automaticamente come parte della logica di corrispondenza. Ad esempio, la definizione di una tabella a due colonne con colonne di testo "Da" e "A" con valori "Microsoft" e "MSFT" farà in modo che questi due valori siano considerati uguali (punteggio di similarità pari a 1,00).
-
-
Power Query analizza entrambe le tabelle e visualizza un messaggio sul numero di corrispondenze effettuate. Nell'esempio la selezione corrisponde a 3 di 4 righe della prima tabella. Senza usare la corrispondenza fuzzy, corrisponderebbero solo 2 righe su 4.
-
Se sei soddisfatto, seleziona OK. In caso contrario, provare diverse opzioni di unione Fuzzy per personalizzare l'esperienza.
-
Al termine, scegliere OK.
Vedere anche
Guida di Power Query per Excel