Я пробую простой пример потоковой передачи файлов, используя Sparkstreaming (spark-streaming_2.10, версия: 1.5.1)
public class DStreamExample {
public static void main(final String[] args) {
final SparkConf sparkConf = new SparkConf();
sparkConf.setAppName("SparkJob");
sparkConf.setMaster("local[4]"); // for local
final JavaSparkContext sc = new JavaSparkContext(sparkConf);
final JavaStreamingContext ssc = new JavaStreamingContext(sc,
new Duration(2000));
final JavaDStream<String> lines = ssc.textFileStream("/opt/test/");
lines.print();
ssc.start();
ssc.awaitTermination();
}
}
Когда я запускаю этот код в одном файле или директории, он ничего не печатает из файла, я вижу в журналах его постоянный опрос, но ничего не печатается. Я попытался переместить файл в каталог, когда эта программа работала.
Есть ли что-то, что мне не хватает? Я попытался применить функцию карты к строкам RDD, которая также не работает.