
이번 포스팅에서는 데이터 분석 플랫폼 KNIME와 SQL 프로그램 PostgreSQL을 연결했다. 전체적인 과정은 단순한데, 하나씩 살펴보자.

제일 먼저, 사용하는 DBMS를 연결한다. 개인적으로 PostgreSQL을 사용하고 있어서, 해당 DB를 연결했다. Hostname과 연결할 Database name을 입력하고, 사용자 이름과 비밀번호를 입력하면된다.

데이터를 KNIME에 가져와서 테이블로 만들기 위해 2가지 방법을 사용할 수 있다. 예시로 DB에 있는 2가지 테이블을 join 해보았다. 첫 번째 방법은 DB Query Reader node에서 SQL Query를 사용해서 select 부터 join까지 하나의 node로 처리하는 방법이다. SQL에 익숙하다면, 이 방법이 훨씬 효율적이라고 생각된다.



두 번째 방법은 테이블을 하나씩 불러오고, DB joiner로 합치는 방법이다. SQL 언어를 모르는 사람도 KNIME을 통해 분석할 수 있다는 장점이 있지만, 필요한 테이블을 하나씩 불러오고 합치는 과정이 상당히 번거로울 수 있다.

결과를 확인해보면, 둘 다 동일한 출력이 나옴을 확인할 수 있다. KNIME에 SQL로 만든 쿼리를 가져온다면, python과 병행해서 쓰기도 편하고 전처리도 쉽게 할 수 있다는 생각이 들었다.
'Data Science' 카테고리의 다른 글
| [Retention] 리텐션 (0) | 2024.02.15 |
|---|---|
| [RFM] 고객 세분화 분석이란? (0) | 2024.01.19 |
| [Pytorch] 가중치 초기화 (0) | 2023.10.26 |
| [Linux] 명령어 정리 (0) | 2023.10.22 |
| [정규화] 정규화의 역할 및 종류 (0) | 2023.10.13 |