Как считать дубликаты в Google Sheets

Электронные таблицы являются очень полезным инструментом для организации, сортировки, управления и создания отчетов из всех видов данных. Многие люди используют облачные электронные таблицы, такие как Google Sheets, для анализа своих данных и часто сталкиваются с проблемой дублирования данных. Дублированные данные означают несколько экземпляров точно таких же данных, где должен быть только один экземпляр.

Данные могут включать в себя все, от цифр до адресов электронной почты, и любые другие типы данных, которые вы хотите использовать в своей электронной таблице только один раз. Вы не хотите удваивать счет при выполнении расчетов с числами и часто со списками адресов электронной почты, которые вы загружаете в поставщика услуг электронной почты, вам не нужны дублирующие адреса электронной почты.

Иногда удаление этих дубликатов необходимо для обработки данных в электронной таблице, но в других случаях мы не хотим изменять данные, но хотим знать, сколько раз конкретное значение дублируется в наших данных. В этой статье я покажу вам несколько различных способов подсчета дубликатов в листах, а также способы решения проблем с дубликатами данных в листах Google.

В этой статье вы научитесь считать дубликаты с помощью встроенных функций, а также научитесь находить и удалять дубликаты с помощью необходимого дополнения для опытных пользователей Google Sheets под названием Power Tools.

Подсчет дубликатов с COUNTIF

COUNTIF — это относительно базовая функция Google Sheets, которая подсчитывает ячейки, содержащие числа или текст, в зависимости от заданного условия. Синтаксис прост; вам нужно только указать диапазон ячеек и критерий для подсчета клеток. Вы можете ввести функцию COUNTIF в строке fx с синтаксисом: `= COUNTIF (диапазон, критерий)`.

Теперь давайте настроим электронную таблицу с некоторыми фиктивными данными, которые мы можем включить в функцию COUNTIF. Откройте пустую электронную таблицу в Google Sheets и введите значения «450», «350», «560», «450», «350» и «245» в диапазоне ячеек A2: A7. Ваша таблица должна быть точно такой же, как показано ниже.

Чтобы добавить функцию COUNTIF в электронную таблицу, выберите ячейку B9 и щелкните на панели эффектов. Введите ‘= COUNTIF (A2: A7,« 450 »)’ на панели эффектов и нажмите клавишу Return, чтобы добавить функцию в ячейку. Ячейка B9 теперь будет содержать значение 2. Таким образом, она подсчитывает два повторяющихся значения 450 в диапазоне ячеек A2: A7.

COUNTIF также считает дубликаты текстовых строк почти такими же, как числовые данные. Замените числовой критерий функции текстом. Например, введите «текстовую строку» в ячейки A8 и A9 вашей электронной таблицы. Затем введите функцию ‘= COUNTIF (A2: A9,« текстовая строка »)’ в ячейку B10. B10 подсчитает две ячейки, которые содержат дублированный текст, как показано на снимке ниже.

Вы также можете добавить формулу в электронную таблицу, которая подсчитывает несколько повторяющихся значений в пределах одного диапазона ячеек. Эта формула добавляет две или более функции COUNTIF вместе. В качестве примера введите формулу 11 = COUNTIF (A2: A7, «450») + COUNTIF (A2: A7, «350») ’в ячейке B11. Это подсчитывает как 450, так и 350 повторяющихся чисел в столбце A. В результате B11 возвращает значение 4, как в снимке непосредственно ниже.

Считать дубликаты с COUNT и COUNTA

COUNT — это еще одна функция, которая может подсчитывать повторяющиеся значения в диапазонах ячеек электронной таблицы. Однако в эту функцию можно включить только диапазоны ячеек. Таким образом, COUNT не очень хорош, если у вас есть листы с дублирующимися значениями, разбросанными по множеству отдельных диапазонов ячеек в столбцах или строках. Эта функция намного эффективнее для подсчета дубликатов при сортировке данных по строкам и столбцам.

Щелкните правой кнопкой мыши заголовок столбца A в электронной таблице Sheets и выберите параметр «Сортировать листы A-Z». Это упорядочит ячейки вашего столбца в числовом порядке с самыми низкими числами вверху и самыми высокими значениями внизу, как на снимке непосредственно ниже. Это также группирует все повторяющиеся значения вместе в пределах одной ячейки.

Следовательно, теперь вам нужно всего лишь ввести одну ссылку на ячейку в функции COUNT, чтобы она подсчитала все повторяющиеся значения в диапазоне. Например, введите ‘= COUNT (A2: A3)’ в ячейку B12 электронной таблицы Sheets. Функция СЧЕТА B12 затем вернет значение 2, которое является количеством дубликатов в диапазоне A2: A3.

Параметр «Сортировка листа A-Z» также группирует дублированный текст в строки и столбцы в пределах отдельных ячеек. Однако COUNT работает только для числовых данных. Для дублированного текста добавьте функцию COUNTA в электронную таблицу. Например, введите ‘= COUNTA (A7: A8)’ в B13 вашей электронной таблицы, которая будет подсчитывать повторяющиеся ячейки текстовой строки, как показано ниже.

Подсчитайте все дубликаты с помощью электроинструмента

Power Tools — это дополнение к Google Sheets, в котором есть множество удобных инструментов. Вы можете добавить его в приложение с этой страницы. В Power Tools есть опция «Удалить дубликаты», которая позволяет найти все дублирующиеся значения и текст в выбранном диапазоне ячеек. Таким образом, вы можете использовать этот инструмент для подсчета всего дублированного содержимого ячейки в выбранном столбце или строке.

Откройте функцию Dedupe and Compare в Power Tools, выбрав Электроинструменты от Дополнения выпадающее меню, затем выберите Дедупе и сравни вариант.

Примечание: «Dedupe and Compare» раньше называлось «Data». Несмотря на изменение имени функции, Dedupe и Compare выполняют те же операции дедупликации и сравнения, что и Data.

Нажмите кнопку ссылки на ячейку, чтобы выбрать диапазон ячеек A1: A8, и нажмите кнопку ОК. Нажмите следующий и выберите опцию Дубликаты + 1-е вхождения.

Нажмите на следующий Снова нажмите кнопку, чтобы открыть параметры, показанные непосредственно ниже. Установите флажок «Столбец» и нажмите следующий снова.

Выберите Добавить столбец статуса переключатель, который добавляет новый столбец с дублирующимися значениями в электронную таблицу. Существует также опция «Цвет заливки», которую можно выбрать, чтобы выделить дублирующиеся ячейки цветами. Когда вы нажимаете Конец Кнопка, надстройка говорит вам, сколько дубликатов в пределах выбранного диапазона ячеек.

Таким образом, надстройка считает все шесть дубликатов в диапазоне ячеек электронной таблицы. Это включает пару значений 350 и 450 и ячейки текстовой строки. Ваш лист также будет содержать новый столбец B, выделяющий строки A с дубликатами, как показано ниже.

Как вы можете видеть, существует множество способов подсчета или выделения дубликатов в электронных таблицах Sheets с помощью функций и Power Tools, необходимого дополнения для любого опытного пользователя Google Sheets. Если вы пользуетесь Google Sheets регулярно, вы обнаружите, что Power Tools быстро станут неотъемлемой частью вашего набора инструментов Google Sheets. Вы также можете автоматизировать такие процессы, как поиск и устранение проблем с дублирующимися данными, используя скрипты Google Apps. это мощный инструмент для продвинутых пользователей Google Apps, которые чувствуют себя комфортно при написании кода.

Вам также может понравиться эта статья TechJunkie с практическими рекомендациями о том, как получить абсолютную стоимость в Google Sheets. Если у вас есть какие-либо советы и рекомендации по Google Листам, опубликуйте их в комментариях ниже.

Ссылка на основную публикацию
Adblock
detector