Usuwanie duplikatów
22 kwi 2008
W artykule Poszukiwanie duplikatów w Excelu opisałem bardzo przyjemny sposób zaznaczania takich samych wartości w obrębie listy. Jako że często kolejną czynnością jest usunięcie ich z listy, przedstawię pokrótce szybki sposób wykonania tego zadania. Opisywana poniżej metoda działa w Excelu 2007.
Nareszcie Excel otrzymał funkcję, dzięki której praktycznie jednym kliknięciem możemy usunąć duplikaty z listy. Wymaga ona od nas tylko zaznaczenia listy, przejścia na zakładkę Dane i kliknięcia na przycisku Usuń duplikaty .

W pojawiającym się okienku możemy jeszcze zaznaczyć, które kolumny mają być poddane sprawdzeniu. Zatrzymajmy się na chwilę przy tej opcji. Sprawa jest w tym momencie prosta, jeśli wcześniej zaznaczyliśmy tylko jedną kolumnę. Wtedy w okienku również mamy do wyboru tylko tą kolumnę. Po zatwierdzeniu duplikaty są usuwane, a użytkownik otrzymuje informację o ilości skasowanych oraz unikatowych wartości w liście. Kto potrzebuje tylko takiego działania, może nie czytać dalej.
Jeśli lista składa się z kilku kolumn, sprawa wygląda nieco inaczej. Oto dwie listy, w których duplikaty są różnie rozłożone:

Na początek zaznaczamy listę nr 1 tak, żeby zaznaczenie obejmowało kolumnę Osoba i Data. Nagłówków nie musimy zaznaczać. Klikamy na Usuń duplikaty i w okienku Usuwanie duplikatów pozostawiamy obie kolumny zaznaczone.

Po zatwierdzeniu okazuje się, że Excel nie znalazł żadnych duplikatów. Dzieje się tak dlatego, bo w tym przypadku Excel sprawdza, czy zduplikowane są wiersze danych (rekordy), a nie jedynie wartości w poszczególnych kolumnach. Jeśli zaznaczymy listę nr 2 i wykonamy na niej dokładnie te same czynności, to Excel usunie jeden rekord, a mianowicie ostatni wiersz. W przypadku, gdy do sprawdzenia używamy obu kolumn, jest to dla Excela jedyny duplikat w tej liście.
Wycofajmy zmiany i powróćmy do poprzedniego stany listy. Przy okazji wspomnę, że używając tej funkcji należy pamiętać o tym, że usuwa ona dane trwale (nie są one bynajmniej tylko ukrywane), dlatego lepiej zrobić sobie zawczasu kopię takiej listy.
Co się stanie, jeśli w oknie Usuwanie duplikatów wyłączymy jedną z kolumn? Wtedy poszukiwanie duplikatów rzeczywiście ograniczymy do jednej kolumny. W efekcie Excel usunie duplikaty z tejże kolumny, ale – i tu uwaga – usunie też wartości z komórek znajdujących się w tym samym wierszu co duplikat w kolumnie obok.
Morał z tej historii dla szarego użytkownika Excela jest taki, że jeśli chcemy usunąć duplikaty tylko w jednej kolumnie, to jeszcze przed użyciem funkcji Usuń duplikaty zaznaczamy tylko tę kolumnę . Ale nawet jeśli tak zrobimy, a w kolumnie obok znajdują się jakieś dane, to Excel łatwo się nie podda i spyta nas, czy rozszerzyć zaznaczony obszar na pozostałe przyległe kolumny zawierające dane. Tu musimy oczywiście stanowczo powiedzieć "nie" i nie pozwolić na rozszerzenie zaznaczonego obszaru.

