본문 바로가기

루덴스코드/Etc

Weka 를 이용한 머신러닝 소개

Weka 는 뉴질랜드 Waikato 대학에서 제작한 대표적인 데디터마이닝 도구다. 이안 위튼은 Weka 를 이용한 데이터마이닝 MOOC 를 제공하고 있다. 무료로도 가능하고, 제한없는 강의를 듣기 원하면 $89 을 내면 된다. 물론 영어로 이루어진다. [관련링크]

Weka 를 이용한 Data Mining 은 한두시간에 다룰 가벼운 주제는 아니다. 실제로 사용되는 머신러닝에 대한 기본적인 이해를 가지고 있어야 하고 다양한 응용이 가능해야 한다. 이안 위튼이 쓴 Data Mining 책은 한글로 번역되어 구입이 가능하다. 관심이 있다면 이 책을 구입해서 읽어보고, 위 사이트에서 영어로 된 강의를 들어보는 것도 좋을 듯 하다.

아주 간단한 Weka 에 대한 튜토리얼은 유튜브에서 검색하면 쉽게 찾을 수 있다. 다만 짧게 된 소개를 보고 Weka 를 다 이해한다는 것은 무리다. 일반적으로 붓꽃에 대한 데이터를 가지고 간단한 소개를 진행한다.

 



Weka 가 어렵거나 복잡하지 않으면(사실 어렵지는 않다. 뭔가 많이 붙어있어서 복잡할 뿐이다), 따로 소개와 함께 사용법을 만들어 볼까 했는데, 그건 당분간 보류한다. 생각보다 다뤄야 할 것들이 많을 것 같다. 그보다는 확률과 통계에 기반한 수학과 인공지능 혹은 머신러닝이 지금까지 걸어온 길을 소개해주는 글을 쓰는 것이 나을 것 같다. 소개하면서 발견하는 좋은 프로그램, 툴들을 소개는 하되 깊이 있게 다루지는 않겠다. 첫째, 내가 그 툴들을 제대로 사용해 본 적이 없기 때문이고, 둘째 툴들의 소개는 상당한 시간이 소요되고, 셋째, 툴들은 계속해서 수정되고 업그레이드되면서 바뀔 것이기 때문이다.

꼭 필요한 내용들을 선정하고 그것들을 중심으로 다루면서 Weka 와 같은 툴들은 소개하는 선에서 넘어가야 할 것 같다.