У нас есть приложение производителя, которое работает уже несколько дней и создает данные для темы A. Мы хотим, чтобы коннектор hdfs читал из темы A, но НЕ со смещения 0 (поскольку это приведет к огромному отставанию). Мы хотим начать с последнего смещения (в тему A постоянно поступают новые данные).
1) Поскольку коннектор получает информацию о смещении из имен тем в hdfs, как мы можем прочитать последнее смещение, поскольку в hdfs нет файлов?
2) Один из вариантов, который я могу придумать, - это вручную создать фиктивные файлы с последними смещениями для каждого раздела, но мы говорим о 60 разделах в теме A, так что есть ли более элегантный способ сделать это?