본문 바로가기

Study/Data

[Power Query] 데이터 가져오기 및 로드

손쉽게 데이터 전처리를 하기위해 엑셀 파워쿼리 사용

텍스트 나누기, 함수 삽입 등의 엑셀 기본기능을 활용하여 정제하던 데이터를

파워쿼리를 통해 동일한 패턴의 반복 작업을 최소화 하여 전처리를 일부 자동화하는 것이 목표 

(Excel 2016 버전부터 파워쿼리기능 기본제공.)

 

[데이터 가져오기]

정제 대상이 되는 RAW 데이터는 대부분 엑셀 또는 CSV 파일이기 때문에

[데이터>새쿼리>파일에서]  메뉴를 가장 많이 활용함

엑셀 파일 - [통합문서에서]

CSV 파일 - [CSV에서] 

동일 유형의 포멧끼리 폴더로 묶여있고 하위 파일을 통합해서 작업하고 싶다면 [폴더에서]를 선택

 

혹, 현재 활성화 되어있는 파일내 전처리가 필요한 데이터가 존재한다면 [데이터>테이블에서] 선택하여 사용

[새쿼리]

간혹 공동작업이 필요한 데이터의 경우 Google Sheet를 활용하기에

해당 데이터를 가져다 쓰고 싶다면 [데이터>새쿼리>기타원본에서>웹에서] 선택하여 사용

 

[통합문서, CSV, 폴더, 테이블, 웹 이외의 데이터소스에서 정보를 불러들이는 방식은 이후 직접 사용하게되면 업데이트하는것으로....]

 

[결과물 로드]

작업완료 후, [파일>닫기 및 로드 OR 닫기 및 다음으로 로드] 선택하여 결과물 확인.

닫기 및 로드는 생성/변경된 쿼리가 엑셀내 출력되고,

닫기 및 다음으로 로드는 아래와 같이 엑셀로 출력할 것인지, 연결만 만들어 활용할 것인지 선택 할 수 있음

[쿼리 출력방식]

작업 쿼리가 적다면 모두 엑셀 시트에서 확인하며 작업해도 무방하지만,

참조되는 쿼리가 많다면 참조되는 쿼리는 연결만 만들고

실제 결과물만 엑셀로 로드하는게 편리함.

 

이미 참조되는 쿼리들을 로드했다면, 

엑셀 워크시트 내에서 [데이터>쿼리표시] 연결전용을 변경하기 원하는 쿼리 우클릭 후

다음으로 로드.. 선택하면 위의 화면이 출력되고 변경할 수 있음.

[로드방식 변경]