Hadoop集群客户端访问与Cloudera Hue配置指南
1. 客户端访问Hadoop集群
客户端访问Hadoop集群以利用其提供的服务和存储的数据时,安全访问是一项艰巨的任务,因为客户端有众多的访问点。客户端必须遵守既定的认证和授权方法,如Kerberos和LDAP提供的方法。
用户可以使用Sqoop、Hive、Impala、WebHDFS和HttpFS等工具从集群中提取数据。随着Hadoop生态系统的发展,与之交互的商业智能、ETL和其他相关工具的生态系统也在不断扩大。因此,管理员了解平台的数据提取能力及其安全模式至关重要。
2. Cloudera Hue简介
Cloudera Hue是一个Web应用程序,为Hadoop生态系统中的大量项目提供以终端用户为中心的界面。
2.1 Kerberos配置
当Hadoop配置了Kerberos认证时,Hue必须配置Kerberos凭证才能正确访问Hadoop。在hue.ini文件中设置以下参数来启用Kerberos:
- hue_principal
:Hue的Kerberos主体名称,包括Hue服务器的完全限定域名。
- hue_keytab
:包含Hue服务凭证的Kerberos keytab文件的路径。
- kinit_path
:Kerberos kinit命令的路径(如果kinit在路径中则不需要)。
- reinit_frequency
:Hue更新其Kerberos票据的频率(以秒为单位)。 <