본문 바로가기

IT/기타

DBeaver로 Hive 서버에 접속하는 방법

반응형

대용량 데이터를 분석할 때 Apache Hive를 많이 사용합니다. 하지만 Hive의 CLI 환경이 불편할 수 있어, GUI 기반의 DBeaver를 이용하면 훨씬 편리하게 데이터를 조회하고 관리할 수 있습니다. 이 글에서는 DBeaver에서 Hive 서버에 접속하는 방법을 단계별로 설명하겠습니다.

🔹 1. DBeaver 설치

DBeaver는 다양한 데이터베이스를 지원하는 강력한 GUI 툴입니다. 먼저, DBeaver 공식 홈페이지에서 Community Edition을 다운로드하여 설치합니다.

✅ DBeaver 다운로드: 🔗 https://dbeaver.io/download/

설치가 완료되면 DBeaver를 실행합니다.

🔹 2. Hive JDBC 드라이버 다운로드 및 설정

Hive에 접속하려면 JDBC 드라이버가 필요합니다. DBeaver는 기본적으로 Hive 드라이버를 제공하지만, 최신 버전이 필요할 수 있습니다.
✅ Cloudera Hive JDBC 드라이버 다운로드
🔗 https://www.cloudera.com/downloads/connectors/hive/jdbc.html

👉 JDBC 드라이버 추가 방법

  1. DBeaver 실행
  2. 상단 메뉴에서 Database → Driver Manager 클릭
  3. Apache Hive 선택 후 Edit 버튼 클릭
  4. Libraries 탭에서 Download/Update 버튼을 눌러 자동 다운로드
  5. 또는 Cloudera JDBC for Hive에서 직접 다운로드하여 추가
  6. OK 버튼을 눌러 설정 저장

🔹 3. Hive 서버 정보 확인

Hive 서버에 접속하려면 다음 정보가 필요합니다.

  • Host: Hive 서버의 IP 또는 도메인 (예: 192.168.1.100 또는 hive-server.company.com)
  • Port: Hive 서버 포트 (기본값 10000)
  • Database: 사용할 Hive 데이터베이스 (예: default)
  • Username: Hive 사용자 계정
  • Password: Hive 비밀번호 (없으면 빈칸)

🔹 4. DBeaver에서 Hive 연결 설정

이제 DBeaver에서 Hive 서버에 연결을 설정해 보겠습니다.

👉 Hive 연결 설정 방법

  1. DBeaver 실행
  2. Database → New Connection 클릭
  3. Apache Hive 선택 후 Next 클릭
  4. JDBC URL 입력
  5. Username / Password 입력 (필요한 경우)
  6. Finish 클릭
jdbc:hive2://<HIVE_HOST>:10000/default

✅ 연결이 정상적으로 설정되면, DBeaver에서 Hive 테이블을 탐색할 수 있습니다.

🔹 5. Kerberos 또는 인증이 필요한 경우 추가 설정

Hive 서버가 보안 설정을 사용하고 있다면, 추가적인 인증이 필요할 수 있습니다.

✅ Kerberos 인증이 필요한 경우

  • Advanced 설정에서 Use Kerberos 체크 후 관련 정보 입력
jdbc:hive2://zk1:2181,zk2:2181,zk3:2181/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=hiveserver2

✅ Zookeeper를 통한 접속

Hive가 Zookeeper를 사용하여 서버를 관리하는 경우, JDBC URL을 다음과 같이 설정합니다.

✅ LDAP 인증이 필요한 경우

  • Username / Password 입력 후, 추가적인 인증 설정 진행

이와 같은 인증 방식이 필요하면 Hive 서버 관리자에게 설정값을 확인하세요.

🔹 6. 연결 테스트 및 Hive 쿼리 실행

  1. Test Connection 버튼을 눌러 연결이 정상적인지 확인합니다.
  2. 연결이 성공하면 SQL Editor를 열고 Hive 쿼리를 실행할 수 있습니다.
  3. 데이터를 조회하고 필요한 분석을 진행합니다.

이제 DBeaver를 활용하여 Hive 서버에 쉽게 접속하고, 데이터를 조회할 수 있습니다. GUI 환경에서 Hive를 관리하면 SQL 작성과 데이터 분석이 훨씬 편리해집니다. 인증 방식이나 추가 설정이 필요한 경우, Hive 관리자와 협업하여 필요한 정보를 확인하세요.

 

 

Apache Hive란? 빅데이터 분석을 위한 강력한 SQL 기반 데이터 웨어하우스

대용량 데이터를 분석할 때 Apache Hive는 강력한 도구입니다. Hive는 Hadoop 기반의 데이터 웨어하우스 시스템으로, SQL과 유사한 HiveQL을 사용하여 데이터를 쉽게 분석할 수 있도록 설계되었습니다.

make2t.tistory.com

 

반응형