2016-06-27 3 views
0

Sporadisch Ausnahmen wie folgt.Apache Flink: "Fehler beim Auslösen eines Prüfpunkts als Ergebnis des Empfangs der Prüfpunktbarriere"

java.lang.RuntimeException: Error triggering a checkpoint as the result of receiving checkpoint barrier 
    at org.apache.flink.streaming.runtime.tasks.StreamTask$2.onEvent(StreamTask.java:701) 
    at org.apache.flink.streaming.runtime.tasks.StreamTask$2.onEvent(StreamTask.java:691) 
    at org.apache.flink.streaming.runtime.io.BarrierBuffer.processBarrier(BarrierBuffer.java:203) 
    at org.apache.flink.streaming.runtime.io.BarrierBuffer.getNextNonBlocked(BarrierBuffer.java:129) 
    at org.apache.flink.streaming.runtime.io.StreamInputProcessor.processInput(StreamInputProcessor.java:175) 
    at org.apache.flink.streaming.runtime.tasks.OneInputStreamTask.run(OneInputStreamTask.java:65) 
    at org.apache.flink.streaming.runtime.tasks.StreamTask.invoke(StreamTask.java:225) 
    at org.apache.flink.runtime.taskmanager.Task.run(Task.java:559) 
    at java.lang.Thread.run(Thread.java:745) 
Caused by: java.lang.RuntimeException: Failed to fetch state handle size 
    at org.apache.flink.runtime.taskmanager.RuntimeEnvironment.acknowledgeCheckpoint(RuntimeEnvironment.java:234) 
    at org.apache.flink.streaming.runtime.tasks.StreamTask.performCheckpoint(StreamTask.java:528) 
    at org.apache.flink.streaming.runtime.tasks.StreamTask$2.onEvent(StreamTask.java:695) 
    ... 8 more 
Caused by: java.io.FileNotFoundException: No such file or directory 's3n://xxxx/flink/datum/checkpoints/5bdceb1b79bd568de16fe82b01887b96/chk-14046/ee6d12f7-9b96-4f86-b66a-00ccdd23a8cc' 
    at org.apache.hadoop.fs.s3native.NativeS3FileSystem.getFileStatus(NativeS3FileSystem.java:507) 
    at org.apache.flink.runtime.fs.hdfs.HadoopFileSystem.getFileStatus(HadoopFileSystem.java:351) 
    at org.apache.flink.runtime.state.filesystem.AbstractFileStateHandle.getFileSize(AbstractFileStateHandle.java:93) 
    at org.apache.flink.runtime.state.filesystem.AbstractFsStateSnapshot.getStateSize(AbstractFsStateSnapshot.java:134) 
    at org.apache.flink.streaming.runtime.tasks.StreamTaskStateList.getStateSize(StreamTaskStateList.java:87) 
    at org.apache.flink.runtime.taskmanager.RuntimeEnvironment.acknowledgeCheckpoint(RuntimeEnvironment.java:231) 
    ... 10 more 

Aber da ist die Datei. Was soll ich tun, um dieses Problem zu lösen?

+0

flink Version ist 1.0.3. – OnlyUno

+0

Ich bin kürzlich auf dieses Problem in Flink 1.1.3 gestoßen. Ich nehme an, es hat etwas mit dem eventuellen Konsistenzmodell von S3 zu tun, aber ich weiß es nicht genau. – Shannon

Antwort

0

Es sieht so aus, als ob Ihr Problem in diesem Flink JIRA-Problem https://issues.apache.org/jira/browse/FLINK-4218 beschrieben wird, das es als S3-Inkonsistenzproblem bei der Durchführung verzeichnisbasierter Operationen beschreibt. Gemäß dem JIRA-Problem ist es in Flink 1.2 und 1.1.4 (beide derzeit nicht veröffentlicht) gelöst.

Verwandte Themen