Я хочу, чтобы строки массива были уникальными. В отличие от функции unique
numpy, я хочу исключить все строки, которые встречаются более одного раза.
Итак, ввод:
[[1,1],[1,1],[1,2],[2,3],[3,4],[3,4]]
должен привести к выводу
[[1,2],[2,3]].
Я попытался подсчитать появление каждой строки с помощью np.unique(array, return_counts=True)
и впоследствии отфильтровать результат с этими записями, равными >1
. Я ищу как более эффективный способ сделать это, так и сделать то же самое без возвращаемых счетчиков, поскольку они реализованы не ранее numpy 1.9.
Обновление: размер данных в моем случае всегда равен [m,2], но как только концепция определена, ее должно быть легко перенести на случай [m,n]. В моем особом случае набор данных состоит из целых чисел, но решения не должны ограничиваться этим предположением. Типичный набор данных будет иметь m ~ 10^7
.