Odstrániť duplicitné riadky údajov v programe Excel

01 z 02

Odstrániť duplicitné záznamy údajov v programe Excel

Odstrániť duplicity - vyhľadávanie rovnakých záznamov podľa názvu poľa. © Ted French

Programy tabuľkových procesorov, ako je program Excel, sa často používajú ako databázy pre veci, ako sú inventár dielov, záznamy o predaji a zoznamy.

Databázy v programe Excel pozostávajú z tabuliek údajov, ktoré sú zvyčajne usporiadané do riadkov údajov nazývaných záznamy.

V zázname sa vzťahujú údaje v každej bunke alebo poli v riadku - napríklad meno, adresa a telefónne číslo spoločnosti.

Bežný problém, ktorý sa vyskytuje v dôsledku rastu databázy, je duplicitné záznamy alebo riadky údajov.

Toto zdvojenie sa môže vyskytnúť, ak:

Či tak alebo onak, duplicitné záznamy môžu spôsobiť celý rad problémov - napríklad odosielanie viacerých kópií dokumentov tej istej osobe, keď sa informácie o databáze používajú v hromadnej korešpondencii - preto je dobré vyhľadávať a odstraňovať duplicitné záznamy na pravidelných základom.

A hoci je jednoduché vybrať duplicitné záznamy v malej vzorke, ako je tá na obrázku, tabuľky údajov môžu ľahko obsahovať stovky, ak nie tisíce záznamov, čo veľmi sťažuje výber duplicitných záznamov - najmä čiastočne zodpovedajúcich záznamov.

Aby bolo možné túto úlohu ľahšie splniť, program Excel má zabudovaný dátový nástroj nazvaný, nie je prekvapením, odstrániť duplikáty , ktoré možno použiť na vyhľadanie a odstránenie rovnakých a čiastočne zodpovedajúcich záznamov.

Avšak spôsob, akým je nástroj Remove Duplicates navrhnutý, identické a čiastočne zodpovedajúce záznamy, sa musia riešiť oddelene.

Dôvodom je, že dialógové okno Odstrániť duplikáty zobrazuje názvy polí pre zvolenú tabuľku údajov a vyberiete, ktoré polia sa majú zahrnúť do vyhľadávania zodpovedajúcich záznamov:

Názvy polí a písmená stĺpcov

Ako sme už uviedli, nástroj Odstrániť duplikáty pozostáva z dialógového okna, v ktorom si vyberiete, ktoré polia na vyhľadávanie sa majú vyhľadať, a to tak, že skontrolujete požadované názvy polí alebo stĺpcov.

Informácie, ktoré sa zobrazujú v dialógovom okne - názvy polí alebo stĺpce - závisia od toho, či vaše dáta obsahujú riadok hlavičiek - alebo hlavičky - v hornej časti tabuľky údajov, ako je vidieť na obrázku vyššie.

Ak to urobí, uistite sa, že možnosť v pravom rohu dialógového okna Moje dáta má hlavičky je označená a Excel zobrazí v poli ako názvy polí názvy v tomto dialógovom okne.

Ak vaše dáta neobsahujú riadok hlavičky, dialógové okno zobrazí príslušné stĺpce v dialógovom okne pre vybratý rozsah údajov.

Súvislý rozsah údajov

Aby nástroj Odstrániť duplikáty fungoval správne, musí byť tabuľka s údajmi súvislý rozsah údajov - to znamená, že nesmie mať žiadne prázdne riadky, stĺpce a ak je to možné, žiadne prázdne bunky umiestnené v tabuľke.

Neexistujúce medzery v tabuľke údajov je dobrá prax, pokiaľ ide o správu dát vo všeobecnosti a nie len pri hľadaní duplicitných údajov. Ostatné nástroje na spracovanie údajov od spoločnosti Excel - napríklad triedenie a filtrovanie - fungujú najlepšie, keď je údajová tabuľka súvislý rozsah údajov.

Odstrániť duplicitné záznamy záznamov Príklad

Na obrázku vyššie obsahuje tabuľka údajov dva identické záznamy pre A. Thompson a dve čiastočne zodpovedajúce záznamy pre R. Holta - kde sa všetky polia zhodujú s výnimkou čísla študenta.

Nižšie uvedené kroky podrobne opisujú spôsob použitia nástroja na odstránenie duplicít na:

  1. Odstráňte druhý z dvoch identických záznamov pre A. Thompsona.
  2. Odstráňte druhý čiastočne zodpovedajúci záznam pre R. Holta.

Otvorenie dialógového okna Odstrániť duplikáty

  1. Kliknite na ľubovoľnú bunku obsahujúcu údaje v ukážkovej databáze.
  2. Kliknite na kartu Údaje na karte.
  3. Kliknutím na ikonu Odstrániť duplikáty zvýraznite všetky údaje v tabuľke s údajmi a otvoríte dialógové okno Odstrániť duplikáty .
  4. V dialógovom okne Odstrániť duplikáty sa zobrazujú všetky názvy stĺpcov alebo názvy polí z našej vzorky údajov
  5. Začiarknuté políčka vedľa názvov polí označujú, ktoré stĺpce sa pokúsi zhodiť pri hľadaní duplicitných záznamov
  6. Štandardne, keď sa otvorí dialógové okno, všetky názvy polí sú označené

Hľadanie rovnakých záznamov

  1. Pretože hľadáme úplne identické záznamy v tomto príklade, necháme všetky riadky stĺpcov kontrolované
  2. Kliknite na tlačidlo OK

V tomto okamihu by sa mali vidieť nasledujúce výsledky:

02 z 02

Vyhľadanie a odstránenie čiastočne zodpovedajúcich záznamov s odstránením duplicít

Odstrániť duplicity - vyhľadávanie čiastočne zodpovedajúcich záznamov podľa názvu poľa. © Ted French

Kontrola jedného poľa naraz

Keďže aplikácia Excel odstráni iba záznamy údajov, ktoré presne zodpovedajú vybraným údajovým oblastiam, najlepší spôsob, ako nájsť všetky čiastočne zodpovedajúce záznamy údajov, je odstrániť začiarknutie iba jedného poľa naraz, ako je to v krokoch nižšie.

Následné vyhľadávanie záznamov, ktoré sa zhodujú vo všetkých poliach okrem názvu, veku alebo programu, odstráni všetky možné kombinácie pre čiastočne zodpovedajúce záznamy.

Hľadanie čiastočne zodpovedajúcich záznamov

  1. Ak je to potrebné, kliknite na ľubovoľnú bunku obsahujúcu údaje v tabuľke údajov
  2. Kliknite na kartu Údaje na karte.
  3. Kliknutím na ikonu Odstrániť duplikáty zvýraznite všetky údaje v tabuľke s údajmi a otvoríte dialógové okno Odstrániť duplikáty .
  4. Všetky názvy polí alebo nadpisy stĺpcov pre tabuľku s údajmi sú vybraté.
  5. Ak chcete nájsť a odstrániť záznamy, ktoré nemajú zhodu v každom poli, odstráňte značku začiarknutia vedľa tých názvov polí, ktoré program Excel ignoruje.
  6. V tomto príklade kliknite na začiarkavacie políčko vedľa hlavičky stĺpca ID študenta a odstráňte začiarknutie.
  7. Aplikácia Excel teraz vyhľadá a odstráni záznamy, ktoré majú zodpovedajúce údaje v poliach Priezvisko , Počiatočné a Programové .
  8. Kliknite na tlačidlo OK
  9. Dialogové okno by sa malo zavrieť a nahradiť ho hlásením: 1 nájdené a odstránené duplicitné hodnoty; Zostáva 6 unikátnych hodnôt.
  10. Riadok obsahujúci druhý záznam pre R. Holta s ID študenta ST348-252 bude odstránený z databázy.
  11. Kliknutím na tlačidlo OK zatvorte okno správy

V tomto okamihu by mala tabuľka s príkladmi údajov obsahovať všetky duplicitné údaje.