Я хотел бы удалить повторяющиеся пары из списка в столбце при сохранении порядка:
например, ввод:
cola. colb
1. [sitea,siteb,sitea,siteb;sitec,sited,sitec,sited]
ожидаемый результат - это уникальные элементы перед каждым ';' символ
cola. colb
1. [sitea,siteb;sitec,sited]
Я попытался разделить столбец на основе ; символ и создать набор для списка, но это не сработало.
df['test'] = df.e2etrail.str.split(';').map(lambda x : ','.join(sorted(set(x),key=x.index)))
Я также пробовал следующее
df['test'] = df['e2etrail'].apply(lambda x: list(pd.unique(x)))
Любая идея о том, как заставить это работать
[sitea, siteb, sitec, sited]
? Тогда невозможен разделитель;
. Или нужны строки типаsitea,siteb;sitec,sited
? 23.06.2020