%EC%97%91%EC%85%80

2019-07-30
이리저리 조립과 해체를 반복하면서 데이터랑 친해지는 데 엑셀만한 게 없지. 그래서 웬만한 분석은 여전히 엑셀로 한다. 다음은 피벗 테이블을 이용한 사용자 접속 발생 추이. 시간당 최대 접속치는 9000을 넘는다. 이 수치로 알 수 있는 건 무엇일까? 한 명이 9000번 접속? 아니면 9000명이 한 번씩 접속? 해당 그래프는 접속자 ip 개수를 그저 시간 단위로 더한 거라 알 수 없다. 중복되지 않는 접속자 ip의 정확한 개수를 세려면 clientip 필드의 계산 유형을 바꿔야 함. 그런데 중복을 제거해주는 계산 유형이 없다(..)...
2018-12-04
같은 코드의 반복은 중복을 낳는다. 그리고 중복은 유지 보수를 어렵게 만든다. 따라서 반복을 최소화해야 한다. 이 글은 엑셀 파일 데이터를 가공하여 데이터베이스로 옮기거나 혹은 다른 파일 포맷으로 변경하려 할 때 나타날 수 있는 반복 코드와 템플릿/콜백 Template/Callback 패턴을 사용하여 반복 코드를 줄여가는 과정을 소개한다. 반복 코드 엑셀 파일을 읽어 오는 코드를 작성한다고 가정해 보자. Java로 엑셀 파일을 다룰 때 Apache POI (이하 POI)를 많이 사용한다. POI는 마이크로소프트 오피스 포맷(Word, PowerPoint, Excel) 문서를 읽고 쓸 수 있는 Java 라이브러리이다....
2017-06-09
선형 회귀분석(Linear Regression)은 머신러닝을 공부할때 가장 첫번째 배우는 예측분석 모델입니다. 머신러닝 또는 딥러닝을 배우는 입장에서는 처음에 Python, Tensorflow, Keras, R, Matlab 등의 낯선 학습환경을 본인의 PC에 구성해서 하게 되지만 간단한 선형 회귀분석 정도는 마이크로소프트의 밥줄(….), Office의 Excel에서도 아주 손쉽게 구현하여 결과를 확인하고 분석을 진행할 수 있습니다....
2016-08-08
엑셀의 파워피봇을 통해 많은 양의 데이터를 분석할 수 있는 방법...
더보기