Když spojíte sloupce tabulky, už nepotřebujete a přesnou shodu. Funkce Fuzzy matching umožňuje porovnávat položky v samostatných seznamech a spojit je, pokud jsou k sobě blízko. Můžete dokonce nastavit odpovídající toleranci nebo Mezní hodnotu podobnosti.
Běžným případem použití pro fuzzy párování je volné textové pole, například v průzkumu, ve kterém by otázka vašeho oblíbeného ovoce mohla mít překlepy, singulární čísla, množná čísla, velká písmena, malá písmena a další varianty, které se přesnou shodou neshodují.
Fuzzy matching is supported only on merge operations over text columns. Power Query používá algoritmus podobnosti Jaccard k měření podobnosti mezi dvojicemi instancí.
Postup
-
Pokud chcete otevřít dotaz, vyhledejte dříve načtený dotaz z Power Query Editoru, vyberte buňku v datech a pak vyberte Dotaz > Upravit. Další informace najdete v tématu Vytvoření, úprava a načtení dotazu v Excel (Power Query).
-
Vyberte Domů> Sloučit > slučovací dotazy. Můžete taky vybrat Sloučit dotazy jako Nové. Zobrazí se dialogové okno Sloučit s primární tabulkou nahoře.
-
Vyberte sloupec, který chcete použít pro vaši fuzzy shodu. V tomto příkladu vybereme Jméno.
-
V rozevíracím seznamu vyberte sekundární tabulku a potom vyberte odpovídající neostré sloupce shody. V tomto příkladu vybereme Jméno.
-
Vyberte typ spojení. Existuje několik různých způsobů, jak se připojit. Left Outer je výchozí a nejběžnější. Další informace o každém druhu spojení najdete v tématu Slučovací dotazy.
-
Vyberte Použít fuzzy matching k provedení sloučení, vyberte Fuzzy matching optionsa pak vyberte z následujících možností:
-
Mezní hodnota podobnosti Označuje, jak podobné musí být dvě hodnoty, aby odpovídaly. Minimální hodnota 0,00 způsobí, že se všechny hodnoty vzájemně shodují. Maximální hodnota 1,00 umožňuje pouze přesné shody. Výchozí hodnota je 0,80.
-
Ignorovat velká a malá písmena Označuje, jestli se mají textové hodnoty porovnávat rozlišující malá a velká písmena nebo necitlivě. Výchozí chování je malá a velká písmena, což znamená, že se velká a malá písmena ignorují.
-
Maximální počet shod Určuje maximální počet odpovídajících řádků, které budou vráceny pro každý vstupní řádek. Pokud například chcete najít jenom jeden odpovídající řádek pro každý vstupní řádek, zadejte hodnotu 1. Výchozí chování je vrátit všechny shody.
-
Transformační tabulka Zadejte jiný dotaz, který obsahuje tabulku mapování, aby bylo možné některé hodnoty automaticky mapovat jako součást odpovídající logiky. Když třeba definujete tabulku se dvěma sloupci s textem "Od" a "Do" s hodnotami "Microsoft" a "MSFT", budou tyto dvě hodnoty považovány za stejné (skóre podobnosti 1,00).
-
-
Power Query analyzuje obě tabulky a zobrazí zprávu o tom, kolik tabulek odpovídá. V příkladu odpovídá výběr 3 ze 4 řádků z první tabulky. Bez použití neostré shody by odpovídaly jenom 2 ze 4 řádků.
-
Pokud jste spokojení, vyberte OK. Pokud ne, zkuste si přizpůsobit prostředí různými možnostmi hromadné korespondence.
-
Když jste spokojení, vyberte OK.