2016-04-08 3 views
1

Ich verwende 'ibis-framework'. Ich habewie impala namenode rpc portnummer für python ibis oder anträge setzen

hdfs_client = ibis.hdfs_connect(...) 
impala_client = ibis.impala.connect(..., hdfs_client=hdfs_client) 
db = impala_client.database('abc') 
data = pd.DataFrame(...) 
db.create_table('tb_name', obj=data, format='parquet', force=True) 

Dies scheiterte, weil die namenoderpcaddress von requests gebaut (in ibis genannt) hat Port 8020, während die richtige für mich 8022 ist (das ist Cloudera-Anschluss empfohlen, vielleicht für HA-Zwecke).

ConnectionError: HTTPConnectionPool(host='ip-0-0-0-0.ec2.internal', port=50075): Max retries exceeded with url: /webhdfs/v1/tmp/ibis/pandas_7ae170c27ee6426e97e0f84aa9a2a778/0.csv?op=CREATE&user.name=user&namenoderpcaddress=ip-0-0-0-0.ec2.internal:8020&overwrite=false&user.name=user (Caused by NewConnectionError('<requests.packages.urllib3.connection.HTTPConnection object at 0x7feb44be49d0>: Failed to establish a new connection: [Errno -2] Name or service not known',)) 

(IP-Adressen in msg oben von mir bearbeitet wurden)

Jede Idee, wie ich ibis oder Anfragen diese Portnummer berichten?

Danke.

Antwort

Verwandte Themen