Při spojení sloupců tabulky už nepotřebujete přesnou shodu. Přibližné porovnávání umožňuje porovnat položky v samostatných seznamech a spojit je, pokud jsou podobné. Nastavením prahové hodnoty podobnosti můžete upravit odpovídající toleranci.
Běžným případem použití přibližného párování je použití volných textových polí, například v průzkumu, kde odpovědi mohou mít překlepy, jednotné číslo, množné číslo, velká písmena, malá písmena a další varianty.
Přibližné porovnávání je podporováno pouze při operacích sloučení u textových sloupců. Power Query používá algoritmus Jaccard podobnosti k měření podobnosti mezi páry instancí.
Postup
-
Pokud chcete otevřít dotaz, vyhledejte dříve načtený z Editor Power Query, vyberte buňku v datech a pak vyberte Dotaz > Upravit. Další informace najdete v tématu Vytvoření, úprava a načtení dotazu v Excelu (Power Query).
-
Vyberte Domů > Kombinovat dotazy > slučovat. Můžete také vybrat Sloučit dotazy jako Nové. Zobrazí se dialogové okno Sloučit s primární tabulkou v horní části.
-
Vyberte sloupec, který chcete použít pro přibližnou shodu. V tomto příkladu vybereme Jméno.
-
V rozevíracím seznamu vyberte sekundární tabulku a pak vyberte odpovídající sloupec přibližné shody. V tomto příkladu vybereme Jméno.
-
Vyberte druh spojení. Existuje několik různých způsobů, jak se připojit. Levý vnější je výchozí a nejběžnější. Další informace o jednotlivých typech spojení najdete v tématu Sloučení dotazů.
-
Vyberte Použít přibližné porovnávání k provedení sloučení, vyberte Možnosti přibližného párování a pak vyberte některou z následujících možností:
-
Prahová hodnota podobnosti Určuje, jak podobné musí být dvě hodnoty, aby se shodovaly. Minimální hodnota 0,00 způsobí, že se všechny hodnoty budou vzájemně shodovat. Maximální hodnota 1,00 umožňuje pouze přesné shody. Výchozí hodnota je 0,80.
-
Ignorovat malá a velká písmena Určuje, jestli se mají textové hodnoty porovnávat způsobem, který rozlišuje malá a malá písmena nebo ne. Výchozí chování nerozlišuje malá a velká písmena, což znamená, že se ignorují malá a velká písmena.
-
Maximální počet shod Určuje maximální počet odpovídajících řádků, které se vrátí pro každý vstupní řádek. Pokud například chcete najít pouze jeden odpovídající řádek pro každý vstupní řádek, zadejte hodnotu 1. Výchozí chování je vrátit všechny shody.
-
Transformační tabulka Zadejte jiný dotaz, který obsahuje tabulku mapování, aby bylo možné některé hodnoty automaticky mapovat jako součást odpovídající logiky. Například definování dvousloupce tabulky s textovými sloupci From a To s hodnotami "Microsoft" a "MSFT" způsobí, že tyto dvě hodnoty budou považovány za stejné (skóre podobnosti 1,00).
-
-
Power Query analyzuje obě tabulky a zobrazí zprávu o počtu nalezených shod. V tomto příkladu výběr odpovídá 3 ze 4 řádků z první tabulky. Bez použití přibližné shody by se shodovaly pouze 2 ze 4 řádků.
-
Pokud jste spokojení, vyberte OK. Pokud ne, vyzkoušejte různé možnosti hromadného sloučení a přizpůsobte si prostředí.
-
Až budete spokojení, vyberte OK.