이번 포스팅에서는 데이터 분석 플랫폼 KNIME와 SQL 프로그램 PostgreSQL을 연결했다. 전체적인 과정은 단순한데, 하나씩 살펴보자. 제일 먼저, 사용하는 DBMS를 연결한다. 개인적으로 PostgreSQL을 사용하고 있어서, 해당 DB를 연결했다. Hostname과 연결할 Database name을 입력하고, 사용자 이름과 비밀번호를 입력하면된다. 데이터를 KNIME에 가져와서 테이블로 만들기 위해 2가지 방법을 사용할 수 있다. 예시로 DB에 있는 2가지 테이블을 join 해보았다. 첫 번째 방법은 DB Query Reader node에서 SQL Query를 사용해서 select 부터 join까지 하나의 node로 처리하는 방법이다. SQL에 익숙하다면, 이 방법이 훨씬 효율적이라고 생각된다..
KNIME
KNIME에서 python을 사용할 수 있지만, 사용에 앞서 몇 가지 설정해야할 사항들이 있다. 순서대로 알아보도록 하자. Anaconda 설치 Anaconda는 데이터 분석 및 ML에 사용되는 workflow로, KNIME에서 python 가상환경을 만들기 위해 사용된다. 혹시 설치가 되어 있지 않으면, https://www.anaconda.com/download 에서 운영체제에 맞게 설치를 진행하면 된다. 설치가 끝났으면, KNIME을 실행하고 왼쪽 상단의 File -> Preferences로 들어간다. KNIME을 누르면 Conda가 보이는데, 여기서 사전에 설치한 Anaconda의 directory를 설정하고 버전에 이상이 없는지 확인한다. 만약 오류가 있다면, version 정보가 아닌 erro..
KNIME 설치 KNIME은 데이터 분석을 할 수 있는 오픈소스 소프트웨어로, 무료로 다운로드를 받을 수 있다. https://www.knime.com/downloads 에서 로그인 후, 필요한 정보를 기입하면 다운로드가 진행된다. 운영체제에 맞게 다운을 받도록 하자. 포스팅은 윈도우 환경에서 진행되었다. 파일을 다운받고 설치를 하다보면, 위와 같은 화면을 볼 수 있다. KNIME을 사용하는 동안 Memory를 얼마나 사용할지 지정하는 부분인데, 웬만하면 최대로 설정하는 것이 좋다. 메모리가 작으면 실행이 오래걸리고, loop를 돌리다가 프로그램이 꺼져서 진행에 어려움을 겪을 수 있기 때문이다. KNIME 인터페이스 전환(legacy) KNIME이 2023년 7월 ver 5.0 업데이트를 하면서 UI에 ..
지난 주에 이어 KNIME를 활용한 코스피 방향 예측을 계속 진행해보자. 개별 모델의 결과는 다음과 같았다. Model Accuracy Precision Random Forest 56.11 35.48 SVM 60.88 0 Xgboost 53.1 35.14 Catboost 58.23 41.38 LightGBM 54.34 37.91 Model Accuracy Precision Random Forest 60 38.6 SVM 62.3 0 Xgboost 61.06 45.68 Catboost 62.3 50 LightGBM 60.88 44.74 python으로 진행했을 때는 원문과 동일하게 상승 예측 모델이 우세를 보였으나, KNIME은 하락 예측 모델이 우세를 보이고 있음을 확인할 수 있다. 동일한 데이터를 사용했..