Я использую внутреннее соединение в оболочке pyspark следующим образом:
tab_df=ori_df.join(ori_df,ori_df.columns,'inner')
Поскольку я использую ту же таблицу для внутреннего соединения, следует ожидать, что tab_df.count()
должно быть равно ori_df.count()
, но tab_df.count()
дает мне 0!