본문 바로가기
카테고리 없음

[Excel 시각화] 2. 엑셀 함수 및 데이터 전처리 방법

by 꾸리_No9 2024. 4. 2.

 

 

데이터 과학의 80% 데이터 클리닝에 소비되고,
20% 클리닝 시간을 불평하는데 쓴다.
(feat 데이터 전처리)

 

 

 데이터 전처리 :

1.  이상값 제거

     1) 측정오류 : 사람 실수 / 장비 한계

     2) 수집 과정 오류: 데이터 손실 / 중복

 

2. Excel 오류값 제거

#NAME? 함수 이름을 잘못 입력하거나 인수 입력 형식이 잘못된 경우
#N/A 참조 함수 사용 시 찾는 값이 찾을 범위에 없는 경우
#REF! 함수에 참조된 셀이나 범위가 삭제되어 참조할 수 없는 경우
#DIV/0 숫자를 0 또는 빈 셀로 나누는 경우
#NULL 수식에 잘못된 범위 연산자를 사용하거나 교차되지 않는 두 영역의 교집합을 지정하기 위해…

 

 

3. 데이터 전처리 방법 

   (1) 병합 해제 후 동일 셀 채우기

    -.  병합이 있으면 - 피벗, 자동 채우기, 필터, 정렬 불가

    -. 보고 싶지 않은 데이터는 그룹으로 관리 

    -. 처리 방법 : 병합 해제 > Ctrl +a (전체) > Ctrl +g (이동) > 옵션 > 빈 셀 > =상위데이터 > Ctrl +enter

 

 

   (2) 데이터 변환 

    -. 숫자/ 날짜 데이터는 계산 가능, 텍스트는 계산 불가 

    -. 오른쪽 : 숫자/ 날짜

    -. 왼쪽 : 텍스트 

    -. 처리 방법 : (숫자 데이터 → 날짜)  Ctrl + H (찾기 및 바꾸기) > "." to "-"   >  모두 바꾸기 

 

 

   (3) 데이터 분리 

    -. 하나의 셀에 여러 데이터가 기록된 경우, 여러 셀에 분리해야 함

 

 

    -. 처리 방법 : (1) 함수 사용_ LEFT, MID, RIGHT

 

 

 

  -. 처리 방법 : (2) 텍스트 나누기 : 데이터 > 텍스트 나누기 > 너비가 일정함 (조건 선택)

 데이터 함수 :

1. 논리 함수

1) IF = (조건, 처리[참], 처리[거짓])
2) IFERROR = (계산식, 에러 대신 표현)
3) VLOOKUP = 열 참조
4) HLOOKUP = 행 참조



2. 집계 함수

1) SUMIF = (조건 범위, 조건, 찾는 범위)
2) AVERAGEIF = (조건 범위, 조건, 찾는 범위)
3) COUNTIF = (조건 범위, 조건)

 


3. 텍스트 함수

1) TRIM = 공백 제거 (좌우 공백 모두 제거, 중간 공백 띄어쓰기 1칸 제외)
2) SUBSTITUTE = 교체 (셀 지정, "A", "B")
3) TEXT = (서식을 지정할 값, "적용할 서식 코드")
    "aaa" - 날짜 > 국문 요일 변경

    "ddd" - 날짜 > 영문 요일 변경